FMUSER 무선 전송 비디오 및 오디오가 더 쉬워졌습니다!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> 아프리칸스어
sq.fmuser.org -> 알바니아어
ar.fmuser.org -> 아랍어
hy.fmuser.org -> 아르메니아어
az.fmuser.org -> 아제르바이잔 어
eu.fmuser.org -> 바스크
be.fmuser.org -> 벨로루시 어
bg.fmuser.org -> 불가리아어
ca.fmuser.org -> 카탈로니아 어
zh-CN.fmuser.org -> 중국어 (간체)
zh-TW.fmuser.org -> 중국어 (번체)
hr.fmuser.org -> 크로아티아어
cs.fmuser.org -> 체코
da.fmuser.org -> 덴마크어
nl.fmuser.org -> 네덜란드어
et.fmuser.org -> 에스토니아어
tl.fmuser.org -> 필리피노
fi.fmuser.org -> 핀란드어
fr.fmuser.org -> 프랑스어
gl.fmuser.org -> 갈리시아어
ka.fmuser.org -> 조지아 어
de.fmuser.org -> 독일어
el.fmuser.org -> 그리스
ht.fmuser.org -> 아이티 크리올
iw.fmuser.org -> 히브리어
hi.fmuser.org -> 힌디어
hu.fmuser.org 헝가리어
is.fmuser.org -> 아이슬란드 어
id.fmuser.org -> 인도네시아어
ga.fmuser.org -> 아일랜드어
it.fmuser.org -> 이탈리아어
ja.fmuser.org -> 일본어
ko.fmuser.org -> 한국어
lv.fmuser.org -> 라트비아어
lt.fmuser.org 리투아니아어
mk.fmuser.org -> 마케도니아 어
ms.fmuser.org -> 말레이어
mt.fmuser.org -> 몰타어
no.fmuser.org -> 노르웨이어
fa.fmuser.org -> 페르시아어
pl.fmuser.org -> 폴란드어
pt.fmuser.org -> 포르투갈어
ro.fmuser.org -> 루마니아어
ru.fmuser.org -> 러시아어
sr.fmuser.org -> 세르비아어
sk.fmuser.org -> 슬로바키아어
sl.fmuser.org -> 슬로베니아어
es.fmuser.org -> 스페인어
sw.fmuser.org -> 스와힐리
sv.fmuser.org -> 스웨덴어
th.fmuser.org -> 태국
tr.fmuser.org -> 터키어
uk.fmuser.org -> 우크라이나어
ur.fmuser.org -> 우르두어
vi.fmuser.org -> 베트남어
cy.fmuser.org -> 웨일스 어
yi.fmuser.org -> 이디시어
(1) 비디오 신호의 중복 정보
디지털 비디오 녹화의 YUV 구성 요소 형식을 예로 들어 YUV는 각각 밝기와 두 가지 색상 차이 신호를 나타냅니다. 예를 들어, 기존 pal TV 시스템의 경우 휘도 신호의 샘플링 주파수는 13.5mhz입니다. 크로마 신호의 주파수 대역은 일반적으로 6.75mhz 또는 3.375mhz 인 밝기 신호의 절반 이하입니다. 4 : 2 : 2의 샘플링 주파수를 예로 들면 Y 신호는 13.5mhz를 채택하고, 크로마 신호 U와 V는 6.75mhz로 샘플링하고 샘플링 신호는 8bit로 양자화 한 다음 디지털 비디오의 코드 율을 계산할 수 있습니다. 다음과 같이 :
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216Mbit / s
이렇게 많은 양의 데이터를 직접 저장하거나 전송하면 압축 기술을 사용하여 비트율을 낮추기가 어려울 것입니다. 디지털 비디오 신호는 두 가지 기본 조건에 따라 압축 될 수 있습니다.
L. 데이터 중복. 예를 들어, 공간 중복성, 시간 중복성, 구조 중복성, 정보 엔트로피 중복성 등, 즉 이미지의 픽셀간에 강한 상관 관계가 있습니다. 이러한 중복성을 제거한다고해서 정보가 손실되는 것은 아니며 무손실 압축입니다.
L. 시각적 중복. 밝기 판별 임계 값, 시각적 임계 값과 같은 인간 눈의 일부 특성은 밝기 및 채도에 대한 민감도가 다르므로 코딩에 적절한 오류를 도입 할 수 없으며 감지되지 않습니다. 인간의 눈의 시각적 특성을 사용하여 특정 객관적인 왜곡이있는 데이터 압축을 교환 할 수 있습니다. 이 압축은 손실이 있습니다.
디지털 비디오 신호의 압축은 위의 두 가지 조건을 기반으로하므로 비디오 데이터가 크게 압축되어 전송 및 저장에 도움이됩니다. 디지털 비디오 압축의 일반적인 방법은 혼합 코딩으로, 변환 코딩, 동작 추정 및 동작 보상, 엔트로피 코딩을 결합하여 코딩을 압축합니다. 일반적으로 변환 코딩은 이미지의 프레임 내 중복성을 제거하기 위해 사용되며, 움직임 추정 및 움직임 보상은 이미지의 프레임 간 중복성을 제거하기 위해 사용되며, 엔트로피 코딩은 압축 효율을 더욱 향상시키기 위해 사용됩니다. 다음 세 가지 압축 코딩 방법이 간략하게 소개됩니다.
(a) 압축 코딩 방법
(b) 변환 코딩
변환 코딩의 기능은 공간 도메인에 설명 된 이미지 신호를 주파수 도메인으로 변환 한 다음 변환 된 계수를 인코딩하는 것입니다. 일반적으로 이미지는 공간에서 강한 상관 관계를 가지며 주파수 영역으로의 변환은 역 상관과 에너지 집중을 실현할 수 있습니다. 일반적인 직교 변환에는 이산 푸리에 변환, 이산 코사인 변환 등이 포함됩니다. 이산 코사인 변환은 디지털 비디오 압축에 널리 사용됩니다.
이산 코사인 변환을 DCT 변환이라고합니다. L * l의 이미지 블록을 공간 영역에서 주파수 영역으로 변환 할 수 있습니다. 따라서 DCT 기반의 영상 압축 및 코딩 과정에서 영상은 비 중첩 영상 블록으로 분할되어야한다. 이미지의 크기가 1280 * 720이라고 가정하고, 그리드 형태로 겹치지 않고 160 * 90 크기의 8 * 8 이미지 블록으로 나뉩니다. 그런 다음 각 이미지 블록에 대해 DCT 변환을 수행 할 수 있습니다.
블록이 분할 된 후 각 8 * 8 포인트 이미지 블록은 DCT 인코더로 전송되고 8 * 8 이미지 블록은 공간 영역에서 주파수 영역으로 변환됩니다. 아래 그림은 숫자가 각 픽셀의 밝기 값을 나타내는 8 * 8 이미지 블록의 예를 보여줍니다. 그림에서 볼 수 있듯이이 이미지 블록의 각 픽셀의 밝기 값은 상대적으로 균일하며, 특히 인접한 픽셀의 밝기 값은 그다지 크지 않아 이미지 신호가 강한 상관 관계를 가지고 있음을 나타냅니다.
실제 8 * 8 이미지 블록
다음 그림은 위 그림에서 이미지 블록의 DCT 변환 결과를 보여줍니다. 그림에서 볼 수 있듯이 DCT 변환 후 좌측 상단의 저주파 계수는 많은 에너지를 집중시키는 반면 우측 하단의 고주파 계수의 에너지는 매우 작습니다.
DCT 변환 후 이미지 블록의 계수
신호는 DCT 변환 후에 정량화되어야합니다. 인간의 눈은 물체의 전체적인 밝기와 같은 이미지의 저주파 특성에 민감하기 때문에 이미지의 고주파 세부 사항에는 민감하지 않으므로 전송 과정에서 고주파 정보는 덜 전송되거나 전송되지 않을 수 있습니다. 저주파 부분. 양자화 과정은 저주파 영역의 계수를 정량화하고 고주파 영역의 계수를 대략 양자화하여 정보 전송을 줄여 사람의 눈에 민감하지 않은 고주파 정보를 제거합니다. 따라서 양자화는 손실 압축 프로세스이며 비디오 압축 코딩에서 품질 손상의 주요 원인입니다.
정량화 과정은 다음 공식으로 표현할 수 있습니다.
그중 FQ (U, V)는 양자화 후의 DCT 계수를 나타냅니다. f (U, V)는 양자화 전 DCT 계수를 나타냅니다. Q (U, V)는 양자화 가중 행렬을 나타내고; q는 양자화 단계이고; round는 통합을 의미하며 출력되는 값은 가장 가까운 정수 값으로 간주됩니다.
양자화 계수를 합리적으로 선택하면 변환 된 영상 블록을 양자화 한 결과가 그림과 같습니다.
정량화 후 DCT 계수
대부분의 DCT 계수는 양자화 후 0으로 변경되는 반면 소수의 계수 만 XNUMX이 아닌 값입니다. 현재는 이러한 XNUMX이 아닌 값만 압축하고 인코딩하면됩니다.
(b) 엔트로피 코딩
엔트로피 코딩은 코딩 후 평균 코드 길이가 소스의 엔트로피 값에 가깝기 때문에 명명됩니다. 엔트로피 코딩은 VLC (가변 길이 코딩)에 의해 구현됩니다. 기본 원리는 통계적으로 더 짧은 평균 코드 길이를 얻기 위해 소스에서 확률이 높은 심볼에 짧은 코드를 부여하고 발생 확률이 작은 심볼에 긴 코드를 부여하는 것입니다. 가변 길이 코딩에는 일반적으로 호프만 코드, 산술 코드, 실행 코드 등이 포함됩니다. 실행 길이 코딩은 매우 간단한 압축 방법이며 압축 효율성이 높지 않지만 코딩 및 디코딩 속도가 빠르며 특히 여전히 널리 사용되고 있습니다. 인코딩 변환 후 실행 길이 코딩을 사용하면 좋은 효과가 있습니다.
첫째, 양자화 기의 출력 DC 계수 바로 다음의 AC 계수는 Z 형으로 스캔되어야합니다 (화살표 선으로 표시됨). Z 스캔은 XNUMX 차원 양자화 계수를 XNUMX 차원 시퀀스로 변환 한 다음 실행 길이 코딩을 수행합니다. 마지막으로 Hoffman 코딩과 같은 다른 가변 길이 코드를 사용하여 인코딩을 실행 한 후 데이터를 인코딩합니다. 이러한 종류의 가변 길이 코딩을 통해 코딩의 효율성이 더욱 향상됩니다.
(c) 움직임 추정 및 움직임 보상
모션 추정 및 모션 보상은 이미지 시퀀스의 시간 방향 상관 관계를 제거하는 효과적인 방법입니다. 위에서 설명한 DCT 변환, 양자화 및 엔트로피 코딩 방법은 하나의 프레임 이미지를 기반으로합니다. 이러한 방법을 통해 이미지의 픽셀 간의 공간적 상관 관계를 제거 할 수 있습니다. 사실, 영상 신호는 공간적 상관 관계 외에도 시간적 상관 관계가 있습니다. 예를 들어, 뉴스 공동 방송과 같이 배경이 정적 인 디지털 영상과 영상의 본체 움직임이 작은 경우 각 영상의 차이가 매우 적고 영상 간의 상관 관계가 매우 크다. 이 경우 각 프레임 이미지를 개별적으로 인코딩 할 필요는 없지만 인접한 비디오 프레임의 변경된 부분 만 인코딩하여 데이터 양을 더 줄일 수 있습니다. 이 작업은 모션 추정과 모션 보상으로 실현됩니다.
모션 추정 기술은 일반적으로 현재 입력 이미지를 서로 겹치지 않는 여러 개의 작은 이미지 서브 블록으로 분할합니다. 예를 들어, 프레임 이미지의 크기는 1280 * 720입니다. 첫째, 40 *의 45 * 16 이미지 블록으로 분할됩니다. 그리드 형태로 서로 겹치지 않는 16 개의 크기로, 이전 이미지 또는 후자 이미지의 검색 창 범위 내에서 각 이미지 블록에 대한 블록을 찾아 하나의 이미지 블록을 찾기 위해 검색 창 가장 유사한 이미지 블록. 검색 프로세스를 모션 추정이라고합니다. 가장 유사한 이미지 블록과 이미지 블록 사이의 위치 정보를 계산하여 움직임 벡터를 얻을 수 있습니다. 이러한 방식으로, 참조 영상 움직임 벡터가 가리키는 가장 유사한 영상 블록에서 현재 영상 블록을 빼서 잔상 블록을 얻을 수있다. 잔상 블록의 각 픽셀 값이 매우 작기 때문에 압축 코딩에서 더 높은 압축 비율을 얻을 수 있습니다. 이 빼기 과정을 동작 보정이라고합니다.
부호화 과정에서 움직임 추정과 움직임 보상을 위해 참조 영상이 필요하기 때문에 참조 영상을 선택하는 것이 매우 중요하다. 일반적으로 인코더는 서로 다른 참조 이미지에 따라 입력 된 각 프레임 이미지를 I (인트라) 프레임, B (안내 예측) 프레임 및 P (예측) 프레임의 세 가지 유형으로 나눕니다. 그림과 같이.
일반적인 I, B, P 프레임 구조 시퀀스
그림에서 볼 수 있듯이 I frame은 코딩을 위해 프레임의 데이터 만 사용하며 코딩 과정에서 움직임 추정 및 움직임 보상이 필요하지 않습니다. 분명히 I 프레임은 시간 방향의 상관 관계를 제거하지 않기 때문에 압축 비율이 상대적으로 낮습니다. 코딩 과정에서 P 프레임은 움직임 보상을위한 참조 이미지로 전면 I 프레임 또는 P 프레임을 사용하며 실제로 현재 이미지와 참조 이미지의 차이를 인코딩합니다. B 프레임의 인코딩 모드는 P 프레임과 유사하지만, 유일한 차이점은 코딩 과정에서 예측하기 위해 전면 I 프레임 또는 P 프레임과 이후의 I 프레임 또는 P 프레임을 사용해야한다는 것입니다. 따라서 각 P 프레임 코딩은 하나의 프레임 이미지를 참조 이미지로 사용해야하고 프레임 B는 두 개의 프레임을 참조로 사용해야합니다. 반면 B 프레임은 P 프레임보다 압축률이 높습니다.
(d) 혼합 코딩
이 백서는 비디오 압축 및 코딩에서 몇 가지 중요한 방법을 소개합니다. 실제 적용에서 이러한 방법은 분리되지 않으며 일반적으로 최상의 압축 효과를 얻기 위해 결합됩니다. 다음 그림은 하이브리드 코딩의 모델을 보여줍니다 (즉, 변환 코딩 + 모션 추정 및 모션 보상 + 엔트로피 코딩). 이 모델은 MPEG1, MPEG2, H.264 및 기타 표준에서 널리 사용되며 그림에서 볼 수 있듯이 현재 입력 이미지를 먼저 블록으로 나누고 블록에서 얻은 이미지의 블록을 움직임 보상 후 예측 영상을 통해 차이 영상 x를 획득 한 다음, 차이 영상 블록에 대해 DCT 변환 및 양자화를 수행합니다. 양자화 된 출력 데이터에는 두 개의 다른 위치가 있습니다. 하나는 코딩을 위해 엔트로피 인코더로 보내는 것이고, 인코딩 된 코드 스트림은 장치의 캐시 저장으로 출력되고 전송을 기다립니다. 또 다른 애플리케이션은 신호 x '의 변경을 카운터 화하고 역방향으로 변경하는 것입니다. 이는 새로운 예측 이미지 신호를 얻기 위해 움직임 보상으로 이미지 블록 출력을 추가하고 새로운 예측 이미지 블록을 프레임 메모리로 보냅니다.
|
놀라움을 얻으려면 이메일을 입력하십시오.
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> 아프리칸스어
sq.fmuser.org -> 알바니아어
ar.fmuser.org -> 아랍어
hy.fmuser.org -> 아르메니아어
az.fmuser.org -> 아제르바이잔 어
eu.fmuser.org -> 바스크
be.fmuser.org -> 벨로루시 어
bg.fmuser.org -> 불가리아어
ca.fmuser.org -> 카탈로니아 어
zh-CN.fmuser.org -> 중국어 (간체)
zh-TW.fmuser.org -> 중국어 (번체)
hr.fmuser.org -> 크로아티아어
cs.fmuser.org -> 체코
da.fmuser.org -> 덴마크어
nl.fmuser.org -> 네덜란드어
et.fmuser.org -> 에스토니아어
tl.fmuser.org -> 필리피노
fi.fmuser.org -> 핀란드어
fr.fmuser.org -> 프랑스어
gl.fmuser.org -> 갈리시아어
ka.fmuser.org -> 조지아 어
de.fmuser.org -> 독일어
el.fmuser.org -> 그리스
ht.fmuser.org -> 아이티 크리올
iw.fmuser.org -> 히브리어
hi.fmuser.org -> 힌디어
hu.fmuser.org 헝가리어
is.fmuser.org -> 아이슬란드 어
id.fmuser.org -> 인도네시아어
ga.fmuser.org -> 아일랜드어
it.fmuser.org -> 이탈리아어
ja.fmuser.org -> 일본어
ko.fmuser.org -> 한국어
lv.fmuser.org -> 라트비아어
lt.fmuser.org 리투아니아어
mk.fmuser.org -> 마케도니아 어
ms.fmuser.org -> 말레이어
mt.fmuser.org -> 몰타어
no.fmuser.org -> 노르웨이어
fa.fmuser.org -> 페르시아어
pl.fmuser.org -> 폴란드어
pt.fmuser.org -> 포르투갈어
ro.fmuser.org -> 루마니아어
ru.fmuser.org -> 러시아어
sr.fmuser.org -> 세르비아어
sk.fmuser.org -> 슬로바키아어
sl.fmuser.org -> 슬로베니아어
es.fmuser.org -> 스페인어
sw.fmuser.org -> 스와힐리
sv.fmuser.org -> 스웨덴어
th.fmuser.org -> 태국
tr.fmuser.org -> 터키어
uk.fmuser.org -> 우크라이나어
ur.fmuser.org -> 우르두어
vi.fmuser.org -> 베트남어
cy.fmuser.org -> 웨일스 어
yi.fmuser.org -> 이디시어
FMUSER 무선 전송 비디오 및 오디오가 더 쉬워졌습니다!
Contact
주소:
No.305 Room HuiLan Building No.273 Huanpu Road 광저우 중국 510620
카테고리
MMCC 뉴스레터