FMUSER 무선 전송 비디오 및 오디오가 더 쉬워졌습니다!

지원하는 언어

es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> 아프리칸스어
sq.fmuser.org -> 알바니아어
ar.fmuser.org -> 아랍어
hy.fmuser.org -> 아르메니아어
az.fmuser.org -> 아제르바이잔 어
eu.fmuser.org -> 바스크
be.fmuser.org -> 벨로루시 어
bg.fmuser.org -> 불가리아어
ca.fmuser.org -> 카탈로니아 어
zh-CN.fmuser.org -> 중국어 (간체)
zh-TW.fmuser.org -> 중국어 (번체)
hr.fmuser.org -> 크로아티아어
cs.fmuser.org -> 체코
da.fmuser.org -> 덴마크어
nl.fmuser.org -> 네덜란드어
et.fmuser.org -> 에스토니아어
tl.fmuser.org -> 필리피노
fi.fmuser.org -> 핀란드어
fr.fmuser.org -> 프랑스어
gl.fmuser.org -> 갈리시아어
ka.fmuser.org -> 조지아 어
de.fmuser.org -> 독일어
el.fmuser.org -> 그리스
ht.fmuser.org -> 아이티 크리올
iw.fmuser.org -> 히브리어
hi.fmuser.org -> 힌디어
hu.fmuser.org 헝가리어
is.fmuser.org -> 아이슬란드 어
id.fmuser.org -> 인도네시아어
ga.fmuser.org -> 아일랜드어
it.fmuser.org -> 이탈리아어
ja.fmuser.org -> 일본어
ko.fmuser.org -> 한국어
lv.fmuser.org -> 라트비아어
lt.fmuser.org 리투아니아어
mk.fmuser.org -> 마케도니아 어
ms.fmuser.org -> 말레이어
mt.fmuser.org -> 몰타어
no.fmuser.org -> 노르웨이어
fa.fmuser.org -> 페르시아어
pl.fmuser.org -> 폴란드어
pt.fmuser.org -> 포르투갈어
ro.fmuser.org -> 루마니아어
ru.fmuser.org -> 러시아어
sr.fmuser.org -> 세르비아어
sk.fmuser.org -> 슬로바키아어
sl.fmuser.org -> 슬로베니아어
es.fmuser.org -> 스페인어
sw.fmuser.org -> 스와힐리
sv.fmuser.org -> 스웨덴어
th.fmuser.org -> 태국
tr.fmuser.org -> 터키어
uk.fmuser.org -> 우크라이나어
ur.fmuser.org -> 우르두어
vi.fmuser.org -> 베트남어
cy.fmuser.org -> 웨일스 어
yi.fmuser.org -> 이디시어

오디오 기본 지식 및 코딩 원칙

1. 기본 개념

1) 비트 전송률 : 인코딩 된 (압축 된) 오디오 데이터를 표시해야하는 초당 비트 수를 나타내며 단위는 일반적으로 kbps입니다.

2) 음량 및 강도 : 소리의 주관적인 속성. 라우드니스는 소리가 얼마나 큰지를 나타냅니다. Loudness는 주로 소리의 강도에 따라 다르지만 주파수에도 영향을받습니다. 일반적으로 순수한 중간 주파수 사운드가 순수한 저주파 및 고주파 사운드보다 낫습니다.

3) 샘플링 및 샘플링 속도 : 샘플링은 연속 시간 신호를 개별 디지털 신호로 변환하는 것입니다. 샘플링 속도는 초당 수집되는 샘플 수를 나타냅니다.

나이 퀴 스트 샘플링 법칙 : 샘플링 속도가 연속 신호의 가장 높은 주파수 성분의 2 배 이상이면 샘플링 된 신호를 사용하여 원래 연속 신호를 완벽하게 재구성 할 수 있습니다.

2. 일반적인 오디오 형식

1) WAV 형식은 Microsoft에서 개발 한 사운드 파일 형식으로 웨이브 사운드 파일이라고도합니다. Windows 플랫폼 및 해당 응용 프로그램에서 널리 지원되는 최초의 디지털 오디오 형식이며 압축률이 낮습니다.

2) MIDI는 Musical Instrument Digital Interface의 약어로 Musical Instrument Digital Interface라고도하며 디지털 음악 / 전자 합성 악기에 대한 통합 국제 표준입니다. 컴퓨터 음악 프로그램, 디지털 신디사이저 및 기타 전자 장치가 음악 신호를 교환하는 방식을 정의하고 케이블과 하드웨어 및 다른 제조업체의 전자 악기를 컴퓨터에 연결하는 장치 사이의 데이터 전송 프로토콜을 지정하고 여러 음악의 사운드를 시뮬레이션 할 수 있습니다. 악기. MIDI 파일은 MIDI 형식의 파일이며 일부 명령은 MIDI 파일에 저장됩니다. 이 지침을 사운드 카드로 보내면 사운드 카드가 지침에 따라 사운드를 합성합니다.

3) MP3의 전체 이름은 MPEG-1 Audio Layer 3로 1992 년에 MPEG 사양에 통합되었습니다. MP3는 높은 음질과 낮은 샘플링 속도로 디지털 오디오 파일을 압축 할 수 있습니다. 가장 일반적인 응용 프로그램입니다.

4) MP3Pro는 스웨덴 코딩 테크놀로지 사가 개발 한 두 가지 주요 기술입니다. 하나는 Coding Technology Company의 고유 한 디코딩 기술이고, 다른 하나는 MP3 특허 보유자 인 French Thomson Multimedia Company와 독일 Fraunhofer A 디코딩 기술의 통합입니다. 회로 협회에 의해. MP3Pro는 기본적으로 파일 크기를 변경하지 않고도 원본 MP3 음악 음질을 향상시킬 수 있습니다. 낮은 비트 전송률로 오디오 파일을 압축하면서 압축 전 음질을 최대한 유지할 수 있습니다.

5) MP3Pro는 스웨덴 코딩 테크놀로지 사가 개발 한 두 가지 주요 기술입니다. 하나는 Coding Technology Company의 고유 한 디코딩 기술이고, 다른 하나는 MP3 특허 보유자 인 French Thomson Multimedia Company와 독일 Fraunhofer A 디코딩 기술의 통합입니다. 회로 협회에 의해. MP3Pro는 기본적으로 파일 크기를 변경하지 않고도 원본 MP3 음악 음질을 향상시킬 수 있습니다. 낮은 비트 전송률로 오디오 파일을 압축하면서 압축 전 음질을 최대한 유지할 수 있습니다.

6) WMA (Windows Media Audio)는 인터넷 오디오 및 비디오 분야에서 Microsoft의 걸작입니다. WMA 형식은 데이터 트래픽을 줄이면서 음질을 유지함으로써 더 높은 압축률을 달성합니다. 압축률은 일반적으로 1:18에 도달 할 수 있습니다. 또한 WMA는 DRM (Digital Rights Management)을 통해 저작권을 보호 할 수도 있습니다.

7) RealAudio는 Real Networks에서 시작한 파일 형식입니다. 가장 큰 특징은 실시간으로 오디오 정보를 전송할 수 있다는 것입니다. 특히 네트워크 속도가 느린 경우에도 데이터를 원활하게 전송할 수 있으므로 RealAudio는 주로 네트워크 플레이 온라인에 적합합니다. 현재 RealAudio 파일 형식은 주로 RA (RealAudio), RM (RealMedia, RealAudio G2), RMX (RealAudio Secured) 등을 포함합니다. 이러한 파일의 공통점은 네트워크 대역폭의 차이에 따라 사운드 품질이 달라진다는 것입니다. 대부분의 사람들이 부드러운 소리를들을 수 있다는 전제하에 더 넓은 대역폭을 가진 청취자는 더 나은 음질을 얻을 수 있습니다.

8) Audible에는 Audible1, 2, 3, 4의 네 가지 형식이 있습니다. Audible.com 웹 사이트는 주로 인터넷에서 오디오 북을 판매하며, 네 가지 Audible.com 전용 오디오 형식 중 하나를 통해 판매하는 상품과 파일에 대한 보호 기능을 제공합니다. . 각 형식은 주로 사용되는 오디오 소스와 청취 장치를 고려합니다. 형식 1, 2 및 3은 서로 다른 수준의 음성 압축을 사용하는 반면 형식 4는 MP3와 동일한 디코딩 방법과 낮은 샘플링 속도를 사용합니다. 그 결과 음성은 더 선명하고 인터넷에서 더 효율적으로 다운로드 할 수 있습니다. Audible은 Audible Manager라는 자체 데스크톱 재생 도구를 사용합니다. 이 플레이어를 사용하면 PC에 저장되어 있거나 휴대용 플레이어로 전송 된 Audible 형식 파일을 재생할 수 있습니다.

9) AAC는 실제로 Advanced Audio Coding의 약어입니다. AAC는 Fraunhofer IIS-A, Dolby 및 AT & T가 공동으로 개발 한 오디오 형식입니다. MPEG-2 사양의 일부입니다. AAC에서 사용하는 알고리즘은 MP3의 알고리즘과 다릅니다. AAC는 다른 기능을 결합하여 코딩 효율성을 향상시킵니다. AAC의 오디오 알고리즘은 압축 기능에서 이전의 일부 압축 알고리즘 (예 : MP3 등)을 훨씬 능가합니다. 또한 최대 48 개의 오디오 트랙, 15 개의 저주파 오디오 트랙, 더 많은 샘플 속도 및 비트 속도, 다국어 호환성 및 더 높은 디코딩 효율성을 지원합니다. 요컨대 AAC는 MP30 파일보다 3 % 작다는 전제하에 더 나은 음질을 제공 할 수 있습니다.

10) Ogg Vorbis는 MP3와 같은 기존 음악 형식과 유사한 새로운 오디오 압축 형식입니다. 그러나 한 가지 차이점은 완전히 무료이고 개방적이며 특허 제한이 없다는 것입니다. Vorbis는이 오디오 압축 메커니즘의 이름이고 Ogg는 완전 개방형 멀티미디어 시스템을 설계하려는 프로젝트의 이름입니다. VORBIS는 또한 손실 압축이지만 손실을 줄이기 위해 고급 음향 모델을 사용합니다. 따라서 동일한 비트 전송률로 인코딩 된 OGG는 MP3보다 사운드가 더 좋습니다.

11) APE는 무손실 압축 오디오 형식으로, 음질이 저하되지 않는다는 전제하에 크기가 기존 무손실 형식 WAV 파일의 절반으로 압축됩니다.

12) FLAC는 무손실 압축을 특징으로하는 잘 알려진 무료 오디오 무손실 압축 코드 세트 인 Free Lossless Audio Codec의 약자입니다.

3. 오디오 코딩의 기본 원리

음성 코딩은 입력 음성의 고품질을 유지하면서 전송에 필요한 채널 대역폭을 줄이는 데 전념합니다.

음성 코딩의 목표는 가능한 가장 낮은 비트 전송률에서 고품질 데이터 전송을 달성하기 위해 복잡성이 낮은 인코더를 설계하는 것입니다.

1) 음소거 임계 값 곡선 : 사람의 귀가 조용한 환경에서만 다양한 주파수의 소리를들을 수있는 임계 값입니다.

2) 임계 주파수 대역

인간의 귀는 주파수에 따라 해상도가 다르기 때문에 MPEG1 / Audio는 22khz 내에서인지 가능한 주파수 범위를 코딩 레이어와 샘플링 주파수에 따라 23 ~ 26 개의 임계 주파수 대역으로 나눕니다. 다음 그림은 이상적인 임계 주파수 대역의 중심 주파수 및 대역폭을 나열합니다. 그림에서 볼 수 있듯이 인간의 귀는 낮은 주파수의 더 나은 해상도를 가지고 있습니다.

3) 주파수 영역의 마스킹 효과 : 진폭이 더 큰 신호는 아래 그림과 같이 유사한 주파수와 더 작은 진폭을 가진 신호를 마스킹합니다.

4) 시간 영역의 마스킹 효과 : 짧은 시간에 두 개의 사운드가 나타나면 SPL (음압 레벨)이 더 큰 사운드가 SPL이 더 작은 사운드를가립니다. 시간 영역 마스킹 효과는 순방향 마스킹 (사전 마스킹)과 역방향 마스킹 (사후 마스킹)으로 나뉩니다. 사후 마스킹 시간은 사전 마스킹보다 약 10 배 더 길어집니다.

시간 영역 마스킹 효과는 프리 에코를 제거하는 데 도움이됩니다.

4. 코딩의 기본 수단

1) 양자화 기 및 양자화 기

양자화 및 양자화 : 양자화는 이산 시간의 연속 신호를 이산 시간의 이산 신호로 변환합니다. 일반적인 양자화 기는 균일 양자화 기, 로그 양자화 기 및 비 균일 양자화 기입니다. 양자화 프로세스가 추구하는 목표는 양자화 오류를 최소화하고 양자화 기의 복잡성을 최소화하는 것입니다 (이 둘은 그 자체로 모순입니다).

(A) 균일 한 양자화 기 : 가장 단순하고 최악의 성능이며 전화 음성에만 적합합니다.

(B) Logarithmic quantizer : 균일 한 양자화 기보다 복잡하고 구현하기 쉬우 며, 균일 한 양자화 기보다 성능이 좋습니다.

2) 음성 인코더

음성 인코더에는 세 가지 유형이 있습니다. (a) 파형 인코더; (b) 보코더; (c) 하이브리드 인코더.

파형 인코더는 배경 노이즈 시트를 포함하여 아날로그 파형을 구성하는 것을 목표로합니다. 모든 입력 신호에 대해 작동하여 고품질 샘플을 생성하고 높은 비트 전송률을 소비합니다. 보코더는 원래 파형을 재생성하지 않습니다. 이 인코더 세트는 음성 생성 모델을 도출하기 위해 수신 측으로 전송되는 매개 변수 세트를 추출합니다. 보코더의 음성 품질이 충분하지 않습니다. 파형 인코더와 사운 더의 장점을 통합 한 하이브리드 인코더.

2.1 파형 인코더

파형 인코더의 디자인은 종종 신호와 무관합니다. 따라서 다양한 신호의 코딩에 적합하며 음성에 국한되지 않습니다.

1) 시간 영역 코딩

a) PCM : 펄스 코드 변조는 가장 간단한 인코딩 방법입니다. 신호의 이산화와 양자화 일 뿐이며 대수 화가 자주 사용됩니다.

b) DPCM : 샘플 간의 차이 만 인코딩하는 차동 펄스 코드 변조. 이전 하나 이상의 샘플은 현재 샘플 값을 예측하는 데 사용됩니다. 예측에 사용되는 샘플이 많을수록 예측 값이 더 정확 해집니다. 참값과 예측값의 차이를 잔차 (residual)라고하며 인코딩의 대상입니다.

c) ADPCM : 적응 형 차동 펄스 코드 변조, 적응 형 차동 펄스 코드. 즉, DPCM을 기반으로 신호의 변화에 따라 양자화 기와 예측기를 적절하게 조정하여 예측값이 실제 신호에 가까워지고 잔차가 작아지고 압축 효율이 높아진다.

(2) 주파수 영역 코딩

주파수 도메인 코딩은 신호를 일련의 서로 다른 주파수 요소로 분해하고 독립적 인 코딩을 수행하는 것입니다.

a) 부대 역 코딩 : 부대 역 코딩은 가장 간단한 주파수 영역 코딩 기술입니다. 원래 신호를 시간 영역에서 주파수 영역으로 변환 한 다음 여러 개의 서브 밴드로 분할하고 각각에 대해 디지털 코딩을 수행하는 기술입니다. 대역 통과 필터 (BPF) 그룹을 사용하여 원래 신호를 여러 (예 : m) 서브 밴드 (서브 밴드라고 함)로 나눕니다. 단일 측 파대 진폭 변조에 해당하는 변조 특성을 통해 각 부대 역을 통과시키고, 각 부대 역을 거의 제로 주파수로 이동하고, 각각 BPF (총 m)를 통과 한 다음, 각 부대 역을 규정 된 속도로 전송합니다 ( 나이 퀴 스트 속도) 서브 밴드 출력 신호가 샘플링되고 샘플링 된 값은 일반적으로 디지털 코딩되며 m 개의 디지털 인코더가 설정됩니다. 각 디지털 코딩 된 신호를 멀티플렉서로 보내고 마지막으로 서브 밴드 코딩 된 데이터 스트림을 출력합니다.

서로 다른 서브 밴드에 대해 서로 다른 양자화 방법을 사용할 수 있으며 사람의 귀 인식 모델에 따라 서로 다른 비트 수를 서브 밴드에 할당 할 수 있습니다.

b) 변환 코딩 : DCT 코딩.

5. 보코더

채널 보코더 : 위상에 대한 인간 귀의 무감각 성을 활용합니다.

동형 보코더 : 합성 신호를 효과적으로 처리 할 수 있습니다.

포먼트 보코더 : 대부분의 음성 신호 정보는 포먼트의 위치와 대역폭에 있습니다.

선형 예측 보코더 : 가장 일반적으로 사용되는 보코더입니다.

6. 하이브리드 인코더

파형 인코더는 코딩 된 신호의 파형을 보존하려고하며 중간 비트 전송률 (32kbps)에서 고품질 음성을 제공 할 수 있지만 비트 전송률이 낮은 경우에는 적용 할 수 없습니다. 보코더는 인코딩 된 신호와 청각 적으로 유사한 신호를 생성하려고 시도하며 낮은 비트 전송률에서 명료 한 음성을 제공 할 수 있지만 결과적으로 음성이 부 자연스럽게 들립니다. 하이브리드 엔코더는 두 가지 장점을 결합합니다.

RELP : 선형 예측을 기반으로 잔차가 인코딩됩니다. 메커니즘은 다음과 같습니다. 잔차의 작은 부분 만 전송하고 수신단에서 모든 잔차를 재구성합니다 (베이스 밴드의 잔차 복사).

MPC : 잔차의 상관 관계를 제거하고 중간 상태의 결함없이 보코더의 음성을 유성음과 무성음으로 간단하게 분류하는 것을 보상하는 데 사용되는 다중 펄스 코딩.

CELP : 코드북 여기 선형 예측. 성대 예측 및 피치 예측기의 캐스케이드를 사용하여 원래 신호에 더 가깝게 접근합니다.

MBE : 다중 대역 여기, 목적은 보코더보다 높은 품질을 얻기 위해 많은 수의 CELP 계산을 피하는 것입니다.