音頻視訊格式介紹
一、常見視訊格式中採用的技術
當 PC 開始擁有 FPU(浮點處理器)後,PC 如何處理多媒體資訊的問題也被擺上台面。無數專家開始為音頻視訊編碼技術運用在 PC 上開始忙碌了,視訊技術也因此得到了飛快的進步。
1、無聲時代的 FLC
FLC、FLI 是 Autodesk 開發的一種視訊格式,僅僅支援 256 色,但支援色彩抖動技術,因此在很多情況下很真彩視訊區別不是很大,不支援音頻訊號,現在看來這種格式已經毫無用處,但在沒有真彩顯示卡沒有音效卡的 DOS 時代確實是最好的也是唯一的選擇。最重要的是,Autodesk 的全系列的動畫製作軟體都提供了對這種格式的支援,包括著名的 3D Studio X,因此這種格式代表了一個時代的視訊編碼水平。直到今日,仍舊有不少視訊編輯軟體可以讀取和生成這種格式。但畢竟廉頗老矣,這種格式已經被無情的淘汰。
2、載歌載舞的 AVI
AVI––Audio Video Interleave,即音頻視訊交叉存取格式。1992 年初 Microsoft 公司推出了 AVI 技術及其應用軟體 VFW(Video for Windows)。在 AVI 檔案中,運動圖像和伴音數據是以交織的方式存儲,並獨立於硬體裝置。這種按交替方式組織音頻和視像數據的方式可使得讀取視訊數據流時能更有效地從存儲媒介得到連續的資訊。構成一個 AVI 檔案的主要參數包括視像參數、伴音參數和壓縮參數等。AVI 檔案用的是 AVI RIFF 形式,AVI RIFF 形式由字串「AVI」標識。所有的 AVI 檔案都包括兩個必須的 LIST 塊。這些塊定義了流和數據流的格式。AVI 檔案可能還包括一個索引塊。
只要遵循這個標準,任何視訊編碼方案都可以使用在 AVI 檔案中。這意味著 AVI 有著非常好的擴充性。這個規範由於是由微軟制定,因此微軟全系列的軟體包括編程工具 VB、VC 都提供了最直接的支援,因此更加奠定了 AVI 在 PC 上的視訊霸主地位。由於 AVI 本身的開放性,獲得了眾多編碼技術研發商的支援,不同的編碼使得 AVI 不斷被完善,現在幾乎所有運行在 PC 上的通用視訊編輯系統,都是以支援 AVI 為主的。AVI 的出現宣告了 PC 上啞片時代的結束,不斷完善的 AVI 格式代表了多媒體在PC 上的興起。
說到 AVI 就不能不提起英特爾公司的 Indeo video 系列編碼,Indeo 編碼技術是一款用於 PC 視訊的高性能的、純軟體的視訊壓縮/解壓解決方案。Indeo 音頻軟體能提供高質量的壓縮音頻,可用於互聯網、企業內部網和多媒體應用方案等。它既能進行音樂壓縮也能進行聲音壓縮,壓縮比可達8:1而沒有明顯的質量損失。Indeo 技術能幫助您構建內容更豐富的多媒體網站。目前被廣泛用於動態效果演示、遊戲過場動畫、非線性素材保存等用途,是目前使用最廣泛的一種 AVI 編碼技術。現在 Indeo 編碼技術及其相關軟體產品已經被 Ligos Technology 公司收購。隨著 MPEG 的崛起,Indeo 面臨著極大的挑戰。
3、容量與質量兼顧的 MPEG 系列編碼
和 AVI 相反,MPEG 不是簡單的一種檔案格式,而是編碼方案。
MPEG-1(標準代號ISO/IEC11172)制定於 1991 年底,處理的是標準圖像交換格式(standard interchange format,SIF)或者稱為源輸入格式(Source Input Format,SIF)的多媒體流。是針對 1.5 Mbps 以下數據傳輸率的數字存儲媒質運動圖像及其伴音編碼(MPEG-1 Audio,標準代號 ISO/IEC 11172-3)的國際標準,伴音標準後來衍生為今天的 MP3 編碼方案。MPEG-1 規範了 PAL 制(352*288,25幀/S)和 NTSC 制(為352*240,30幀/S)模式下的流量標準, 提供了相當於家用錄像系統(VHS)的影音質量,此時視訊數據傳輸率被壓縮至 1.15 Mbps,其視訊壓縮率為 26︰1。使用 MPEG-1 的壓縮算法,可以把一部 120 分鐘長的多媒體流壓縮到 1.2 GB 左右大小。常見的 VCD 就是 MPEG-1 編碼創造的傑作。MPEG-1 編碼也不一定要按 PAL/NTSC 規範的標準運行,你可以自由設定影像尺寸和音視訊流量。隨著光頭拾取精度的提高,有人把光碟的資訊密度加大,並適度降低音頻流流量,於是出現了只要一張光碟就存放一部電影的 DVCD。DVCD 碟其實是一種沒有行業標準,沒有國家標準,更談不上是國際標準的音像產品。
當 VCD 開始向市場普及時,電腦正好進入了 486 時代,當年不少朋友都夢想擁有一塊硬解壓卡,來實現在 PC 上看 VCD 的夙願,今天回過頭來看看,覺得真有點不可思議,但當時的現狀就是486的系統不借助硬解壓是無法流暢播放 VCD 的,上萬元的486 系統都無法流暢播放的 MPEG-1 被打上了貴族的標誌。隨著奔騰的發佈,PC 開始奔騰起來,直到後來 Windows Media Player也直接提供了 MPEG-1 的支援,至此 MPEG-1 使用在 PC 上已經完全無障礙了。
MPEG-2(標準代號 IOS/IEC13818)於 1994 年發佈國際標準草案(DIS),在視訊編碼算法上基本和 MPEG-1 相同,只是有了一些小小的改良,例如增加隔行掃瞄電視的編碼。它追求的是大流量下的更高質量的運動圖像及其伴音效果。MPEG-2 的視訊質量看齊 PAL 或 NTSC 的廣播級質量,事實上 MPEG-1 也可以做到相似效果,MPEG-2 更多的改進來自音頻部分的編碼。目前最常見的 MPEG-2 相關產品就是 DVD 了,SVCD 也是採用的 MPEG-2 的編碼。MPEG-2 還有一個更重要的用處,就是讓傳統的電視機和電視廣播系統往數位的方向發展。
MPEG-3 最初為 HDTV 制定,由於 MPEG-2 的快速發展,MPEG-3 還未徹底完成便宣告淘汰。
MPEG-4 於 1998 年公佈,和 MPEG-2 所針對的不同,MPEG-4 追求的不是高品質而是高壓縮率以及適用於網路的交互能力。MPEG-4 提供了非常驚人的壓縮率,如果以 VCD 畫質為標準,MPEG-4 可以把 120 分鐘的多媒體流壓縮至 300M。MPEG-4 標準主要應用於視像電話(Video Phone),視像電子郵件(Video Email)和電子新聞(Electronic News)等,其傳輸速率要求較低,在4800-64000 bits/sec 之間,解析度為 176X144。MPEG-4 利用很窄的頻寬,通過幀重建技術,壓縮和傳輸數據,以求以最少的數據獲得最佳的圖像質量。
MJPEG,這並不是專門為 PC 準備的,而是為專業級甚至廣播級的視訊採集與在裝置端回放的準備的,所以 MJPEG 包含了為傳統模擬電視優化的隔行掃瞄電視的算法,如果在 PC 上播放 MJPEG 編碼的檔案,效果會很難看(如果你的顯示卡不支援 MJPEG的動態補償),但一旦輸出到電視機端,你立刻會發現這種算法的好處。
4、屬於網路的串流媒體
RealNetworks RealVideo,採用的是 RealNetworks 公司自己開發的 Real G2 Codec,它具有很多先進的設計,例如,SVT (Scalable Video Technology);雙向編碼(Two–Encoding,類似於VBR)。RealMedia 音頻部分採用的是 RealAudio ,可以接納很多音頻編碼方案,可實現聲音在單聲道、立體聲音樂不同速率下的壓縮。最新的 RealAudio 竟然採用 ATRAC3 編碼方案,以挑戰日益成熟的 MP3。
Windows Media,視訊編碼採用的是非常先進的 MPEG-4 視訊壓縮技術,被稱作 Microsoft MPEG-4 Video Codec,音頻編碼採用的是微軟自行開發的一種編碼方案,目前沒有公佈技術資料,在低流量下提供了令人滿意的音質和畫質。最新的 Windows Media Encoding Utility V8.0 將流技術推向到一個新的高度,我們常見的 ASF、WMV、WMA 就是微軟的串流媒體檔案。
事實上我們常見的 MPG 檔案,也具有串流媒體的最大特徵––邊讀邊放。
二、常見的編碼與常見的檔案格式的對應關係及其常用用途
1、Audodesk FLC
這是一種古老的編碼方案,常見的檔案後綴為 FLC 和 FLI。由於 FLC 僅僅支援 256 色的調色板,因此它會在編碼過程中盡量使用抖動算法(也可以設定不抖動),以模擬真彩的效果。這種算法在色彩值差距不是很大的情況下幾乎可以達到亂真的地步,例如紅色 A(R:255,G:0,B:0)到紅色 B(R:255,G:128,B:0)之間的抖動。這種格式現在已經很少被採用了,但當年很多這種格式被保留下來,這種格式在保存標準 256 色調色板或者自定義 256 色調色板是是無損的,這種格式可以清晰到像素,非常適合保存線框動畫,例如 CAD 模型演示。現在這種格式很少見了。
2、Microsoft RLE
這是微軟開發為 AVI 格式開發的一種編碼,檔案擴展名為 AVI,使用了 RLE 壓縮算法,這是一種無損的壓縮算法,我們常見的tga 格式的圖像檔案就使用了 RLE 算法。
什麼是 RLE 算法呢?這是一種很簡單的算法,舉一個很簡單的例子:
假設一個圖像的像素色彩值是這樣排列的:紅紅紅紅紅紅紅紅紅紅紅紅藍藍藍藍藍藍綠綠綠綠,經過 RLE 壓縮後就成為了:紅12 藍 6 綠 4。這樣既保證了壓縮的可行性,而且不會有損失。而且可以看到,但顏色數越少時,壓縮效率會更高。由於Microsoft RLE 僅僅支援 256 色,而且沒有抖動算法,在色彩處理方面,FLC 明顯的比 Microsoft RLE 要好很多。當然這也不表示Microsoft RLE一無是處,和 FLC 一樣,Microsoft RLE 在處理相鄰像素時也沒有色染,可以清晰的表現網格。因此同樣可以優秀的表現單色字體和線條。只要色彩不是很複雜,FLC 能做的,Microsoft RLE 也可以做到。由於 AVI 可以擁有一個音頻流,而且Windows 系統給與了直接的支援,Microsoft RLE 最常用的用途是,在 256 色顯示模式下,通過配合抓屏生成 AVI 的工具製作一個軟體的操作演示過程,以達到圖文並茂,形聲兼備的效果。
3、Microsoft Video1
這也是由微軟提供的一個 AVI 編碼,任何 Windows 系統都自帶了了它的 Codec,這個編碼支援真彩,畫面質量很不錯,Microsoft Video1 的壓縮效率非常低下,編碼後的檔案龐大得讓人受不了。這個 Microsoft Video1 究竟有什麼用呢?一般被用在保存一些沒有漸變的小型視訊素材方面。
4、Indeo video R3.2
這個編碼由 intel 架構實驗室開發,對應的檔案格式是 AVI,相對之前的流行的編碼,Indeo video R3.2 最大的特點就是高壓縮比(當然,比起現在的壓縮方案,實在是不值得一提),intel 聲稱壓縮比可達 8:1 而沒有明顯的質量損失,解碼速度也非常快,對系統要求不高,由於 Windows 9X 中自帶 Indeo video R3.2 的 Codec,所以 Indeo video R3.2 一度成為了最流行的 AVI 編碼方案。
有不少遊戲的過場動畫和啟動動畫都是 Indeo video R3.2 編碼的。Indeo video R3.2 同樣不適合高要求的環境,在要表現細線條或大色彩值變化的漸變時,Indeo video R3.2 會表現得非常糟糕。如果畫面的色彩值差異不是很大,也沒有明顯的色彩區域界限,Indeo video R3.2 還是合適的,例如海天一色的場景。Indeo video R3.2 已經基本被淘汰,如果不是為了播放以前遺留的一些 Indeo video R3.2 編碼視訊,恐怕 Windows ME/2000 都不會有 Indeo video R3.2 的 Codec 了。
5、Indeo video 5.10
這個編碼方案同樣也是 intel 架構實驗室開發的,它繼承了 Indeo video R3.2 的優點,對應的檔案格式仍然是 AVI,解碼速度同樣非常快。Windows ME/2000 自帶了 Indeo video 5.1 的 Codec,很多遊戲也適用 Indeo video 5.10 來編碼自己的演示動畫。在沒有DivX 普及前,這幾乎是最流行的 AVI 編碼了,由於微軟和 intel 的同時支援,這種編碼方案被廣泛採用。
6、None
顧名思義,這是一個沒有損失的視訊編碼方案,對應的檔案擴展名為 AVI。這種編碼幾乎是不壓縮的,檔案大得驚人!那麼這種編碼有什麼用途呢?用途就是保存視訊素材,因為是無損的,保存素材非常合適,代價就是大量的存儲空間。
7、MPEG1
我們熟知的 VCD 就是 MPEG1 編碼的,對應的檔案擴展名為 MPG、MPEG 或者 DAT。事實上 MPEG1 可以工作於非 PAL 制和非NTSC 制標準下。它可以自由設定數據流量和畫面尺寸,只是這樣非標準的檔案無法直接燒錄成 VCD。
8、MPEG2
DVD 的視訊部分就是採用的 MPEG2,SVCD 同樣也採用了 MPEG2 編碼。對應的檔案擴展名一般為 VOB、MPG。MPEG2 的設計目標就是提供接近廣播級的高品質輸出。
9、DivX
DivX 是近 2 年開始被大家認識的,DivX 視訊編碼技術可以說是一種對 DVD 造成威脅的新生視訊壓縮格式(有人說它是 DVD 殺手)對應的檔案擴展名為 AVI 或者 DivX,它由 Microsoft mpeg-4v3 修改而來,使用 MPEG-4 壓縮算法。據說是美國禁止出口的編碼技術。DivX 最大的特點就是高壓縮比和不錯的畫質,更可貴的是,DivX 的對系統要求也不高,只要主頻 300 的 CPU 就基本可以很流暢的播放了,因此從 DivX 誕生起,立刻吸引了大家的注意力。DivX 擁有比 Indeo video 5.10 高太多的壓縮效率,編碼質量也遠遠比 Indeo video 5.10 好,我實在想不出 Indeo video 5.10 還會有什麼前途。
10、PICVideo MJPEG
MJPEG 是很多視訊卡支援的一種視訊編碼,隨卡提供了 Codec,安裝完成後可以像使用其它編碼一樣生成 AVI 檔案。MJPEG 編碼常用於非線性系統,批上了一層很專業的外衣。MJPEG 的編碼質量是相當高的,是一種以質量為最高要求的編碼,這種編碼的設定比較複雜,可以得到很高的壓縮比,但犧牲了解碼速度,如果要保證解碼速度,編碼後的壓縮比確不是很理想,如果您希望從專業的非線性系統上捕捉視訊,然後自行進行處理,這種格式是很有必要去瞭解一些的。
11、RealNetworks RealVideo
REAL VIDEO(RA、RAM)格式由 Real Networks 公司開發的,一開始就定位在視訊流應用方面的,也可以說是視訊流技術的始創者。它可以在用 56K MODEM 撥號上網的條件實現不間斷的視訊播放。從 RealVideo 的定位來看,就是犧牲畫面質量來換取可連續觀看性。其實 RealVideo 也可以實現不錯的畫面質量,由於 RealVideo 可以擁有非常高的壓縮效率,很多人把 VCD 編碼成RealVideo 格式的,這樣一來,一張光碟上可以存放好幾部電影。REAL VIDEO 存在顏色還原不準確的問題,RealVideo 就不太適合專業的場合,但 RealVideo 出色的壓縮效率和支援流式播放的特徵,使得 RealVideo 在網路和娛樂場合佔有不錯的市場份額。
12、Windows Media video
Windows Media video 就是微軟為了和現在的 Real Networks 的 RealVideo 競爭而發展出來的一種可以直接在網上觀看視訊節目的檔案壓縮格式!由於它使用了 MPEG4 的壓縮算法,所以壓縮率和圖像的質量都很不錯。我們經常看到的 ASF 和 WMV 就是Windows Media video。Windows Media video 的編碼質量明顯好於 RealVideo,因為 Windows Media video 是微軟的傑作,所以Windows 系統給 Windows Media video 給與了很好的支援,Windows Media Player 可以直接播放這些檔案。
三、有關音頻編碼
自然界中的聲音非常複雜,波形極其複雜,通常我們採用的是脈衝代碼調製編碼,即 PCM 編碼。PCM 通過抽樣、量化、編碼三個步驟將連續變化的模擬訊號轉換為數字編碼。
1、什麼是采樣率和采樣大小(位/bit)?
聲音其實是一種能量波,因此也有頻率和振幅的特徵,頻率對應於時間軸線,振幅對應於電平軸線。波是無限光滑的,絃線可以看成由無數點組成,由於存儲空間是相對有限的,數字編碼過程中,必須對絃線的點進行采樣。采樣的過程就是抽取某點的頻率值,很顯然,在一秒中內抽取的點越多,獲取得頻率資訊更豐富,為了復原波形,一次振動中,必須有 2 個點的采樣,人耳能夠感覺到的最高頻率為 20 kHz,因此要滿足人耳的聽覺要求,則需要至少每秒進行 40 k 次采樣,用 40 kHz 表達,這個40 kHz 就是采樣率。我們常見的 CD,采樣率為 44.1 kHz。光有頻率資訊是不夠的,我們還必須獲得該頻率的能量值並量化,用於表示訊號強度。量化電平數為 2 的整數次冪,我們常見的 CD 位 16 bit 的采樣大小,即 2 的 16 次方。采樣大小相對采樣率更難理解,因為要顯得抽像點,舉個簡單例子:假設對一個波進行 8 次采樣,采樣點分別對應的能量值分別為 A1-A8,但我們只使用 2 bit 的采樣大小,結果我們只能保留 A1-A8 中 4 個點的值而捨棄另外4個。如果我們進行 3 bit 的采樣大小,則剛好記錄下 8個點的所有資訊。采樣率和采樣大小的值越大,記錄的波形更接近原始訊號。
2、有損和無損
根據采樣率和采樣大小可以得知,相對自然界的訊號,音頻編碼最多只能做到無限接近,至少目前的技術只能這樣了,相對自然界的訊號,任何數字音頻編碼方案都是有損的,因為無法完全還原。在計算機應用中,能夠達到最高保真水平的就是 PCM 編碼,被廣泛用於素材保存及音樂欣賞,CD、DVD 以及我們常見的 WAV 檔案中均有應用。因此,PCM 約定俗成了無損編碼,因為 PCM 代表了數字音頻中最佳的保真水準,並不意味著 PCM 就能夠確保訊號絕對保真,PCM 也只能做到最大程度的無限接近。我們而習慣性的把MP3列入有損音頻編碼範疇,是相對 PCM 編碼的。強調編碼的相對性的有損和無損,是為了告訴大家,要做到真正的無損是困難的,就像用數字去表達圓周率,不管精度多高,也只是無限接近,而不是真正等於圓周率的值。
3、為什麼要使用音頻壓縮技術
要算一個 PCM 音頻流的碼率是一件很輕鬆的事情,采樣率值×采樣大小值×聲道數 bps。一個采樣率為 44.1 KHz,采樣大小為 16 bit,雙聲道的 PCM 編碼的 WAV 檔案,它的數據速率則為 44.1 K×16×2 =1411.2 Kbps。我們常說 128 K 的 MP3,對應的 WAV 的參數,就是這個 1411.2 Kbps,這個參數也被稱為數據頻寬,它和 ADSL 中的頻寬是一個概念。將碼率除以 8,就可以得到這個WAV 的數據速率,即 176.4 KB/s。這表示存儲一秒鐘采樣率為 44.1 KHz,采樣大小為 16 bit,雙聲道的 PCM 編碼的音頻訊號,需要 176.4 KB 的空間,1 分鐘則約為 10.34 M,這對大部分用戶是不可接受的,尤其是喜歡在電腦上聽音樂的朋友,要降低磁片佔用,只有 2 種方法,降低采樣指標或者壓縮。降低指標是不可取的,因此專家們研發了各種壓縮方案。由於用途和針對的目標市場不一樣,各種音頻壓縮編碼所達到的音質和壓縮比都不一樣,在後面的文章中我們都會一一提到。有一點是可以肯定的,他們都壓縮過。
4、頻率與采樣率的關係
採樣率表示了每秒對原始訊號采樣的次數,我們常見到的音頻檔案采樣率多為 44.1 KHz,這意味著什麼呢?假設我們有 2 段正弦波訊號,分別為 20 Hz 和 20 KHz,長度均為一秒鐘,以對應我們能聽到的最低頻和最高頻,分別對這兩段訊號進行 40 KHz 的采樣,我們可以得到一個什麼樣的結果呢?結果是:20 Hz 的訊號每次振動被采樣了 40 K/20=2000 次,而 20 K 的訊號每次振動只有 2 次采樣。顯然,在相同的采樣率下,記錄低頻的資訊遠比高頻的詳細。這也是為什麼有些音響發燒友指責 CD 有數位聲不夠真實的原因,CD 的 44.1 KHz 采樣也無法保證高頻訊號被較好記錄。要較好的記錄高頻訊號,看來需要更高的采樣率,於是有些朋友在捕捉 CD 音軌的時候使用48KHz的采樣率,這是不可取的!這其實對音質沒有任何好處,對抓軌軟體來說,保持和 CD 提供的 44.1 KHz 一樣的采樣率才是最佳音質的保證之一,而不是去提高它。較高的采樣率只有相對模擬訊號的時候才有用,如果被采樣的訊號是數字的,請不要去嘗試提高采樣率。
5、流特徵
隨著網路的發展,人們對在線收聽音樂提出了要求,因此也要求音頻檔案能夠一邊讀一邊播放,而不需要把這個檔案全部讀出後然後回放,這樣就可以做到不用下載就可以實現收聽了。也可以做到一邊編碼一邊播放,正是這種特徵,可以實現在線的直播,架設自己的數字廣播電台成為了現實。
四、各種主流音頻編碼(或格式)的介紹
1、PCM 編碼
PCM 脈衝編碼調製是 Pulse Code Modulation 的縮寫。前面的文字我們提到了 PCM 大致的工作流程,我們不需要關心 PCM 最終編碼採用的是什麼計算方式,我們只需要知道 PCM 編碼的音頻流的優點和缺點就可以了。PCM 編碼的最大的優點就是音質好,最大的缺點就是體積大。我們常見的 Audio CD 就採用了 PCM 編碼,一張光碟的容量只能容納 72 分鐘的音樂資訊。
2、WAVE
這是一種古老的音頻檔案格式,由微軟開發。WAV 是一種檔案格式,符合 PIFF Resource Interchange File Format 規範。所有的WAV 都有一個檔案頭,這個檔案頭音頻流的編碼參數。WAV 對音頻流的編碼沒有硬性規定,除了 PCM 之外,還有幾乎所有支援 ACM 規範的編碼都可以為 WAV 的音頻流進行編碼。很多朋友沒有這個概念,我們拿 AVI 做個示範,因為 AVI 和 WAV 在檔案結構上是非常相似的,不過 AVI 多了一個視訊流而已。我們接觸到的 AVI 有很多種,因此我們經常需要安裝一些 Decode 才能觀看一些 AVI,我們接觸到比較多的 DivX 就是一種視訊編碼,AVI 可以採用 DivX 編碼來壓縮視訊流,當然也可以使用其他的編碼壓縮。同樣,WAV 也可以使用多種音頻編碼來壓縮其音頻流,不過我們常見的都是音頻流被 PCM 編碼處理的 WAV,但這不表示 WAV 只能使用 PCM 編碼,MP3 編碼同樣也可以運用在 WAV 中,和 AVI 一樣,只要安裝好了相應的 Decode,就可以欣賞這些 WAV 了。
在 Windows 平台下,基於 PCM 編碼的 WAV 是被支援得最好的音頻格式,所有音頻軟體都能完美支援,由於本身可以達到較高的音質的要求,因此,WAV 也是音樂編輯創作的首選格式,適合保存音樂素材。因此,基於 PCM 編碼的 WAV 被作為了一種中介的格式,常常使用在其他編碼的相互轉換之中,例如 MP3 轉換成 WMA。
3、OGG編碼
網路上出現了一種叫 Ogg Vorbis 的音頻編碼,號稱 MP3 殺手!Ogg Vorbis 究竟什麼來頭呢?OGG 是一個龐大的多媒體開發計劃的項目名稱,將涉及視訊音頻等方面的編碼開發。整個 OGG 項目計劃的目的就是向任何人提供完全免費多媒體編碼方案!OGG的信念就是:OPEN!FREE!Vorbis 這個詞彙是特裡·普拉特柴特的幻想小說《Small Gods》中的一個"花花公子"人物名。這個詞彙成為了 OGG 項目中音頻編碼的正式命名。目前 Vorbis 已經開發成功,並且開發出了編碼器。
Ogg Vorbis 是高質量的音頻編碼方案,官方數據顯示:Ogg Vorbis 可以在相對較低的數據速率下實現比 MP3 更好的音質!Ogg Vorbis 這種編碼也遠比 90 年代開發成功的 MP3 先進,她可以支援多聲道,這意味著什麼?這意味著 Ogg Vorbis 在 SACD、DTSCD、DVD AUDIO 抓軌軟體(目前這種軟體還沒有)的支援下,可以對所有的聲道進行編碼,而不是 MP3 只能編碼 2 個聲道。多聲道音樂的興起,給音樂欣賞帶來了革命性的變化,尤其在欣賞交響時,會帶來更多臨場感。這場革命性的變化是 MP3無法適應的。
和 MP3 一樣,Ogg Vorbis 是一種靈活開放的音頻編碼,能夠在編碼方案已經固定下來後還能對音質進行明顯的調節和新算法的改良。因此,它的聲音質量將會越來越好,和 MP3 相似,Ogg Vorbis 更像一個音頻編碼框架,可以不斷導入新技術逐步完善。和 MP3 一樣,OGG 也支援 VBR。
4、MPC 編碼
MPC 是又是另外一個令人刮目相看的實力派選手,它的普及過程非常低調,也沒有什麼複雜的背景故事,她的出現目的就只有一個,更小的體積更好的音質!MPC 以前被稱作 MP+,很顯然,可以看出她針對的競爭對手是誰。但是,只要用過這種編碼的人都會有個深刻的印像,就是她出眾的音質。
5、mp3PRO 編碼
2001年6月14日,美國湯姆森多媒體公司(Thomson Multimedia SA)與佛朗赫弗協會(Fraunhofer Institute)於 6 月 14 日發佈了一種新的音樂格式版本,名稱為 mp3PRO,這是一種基於 mp3 編碼技術的改良方案,從官方公佈的特徵看來確實相當吸引人。從各方面的資料顯示,mp3PRO 並不是一種全新的格式,完全是基於傳統 mp3 編碼技術的一種改良,本身最大的技術亮點就在於 SBR(Spectral Band Replication 頻段複製),這是一種新的音頻編碼增強算法。它提供了改善低位率情況下音頻和語音編碼的性能的可能。這種方法可在指定的位率下增加音頻的頻寬或改善編碼效率。SBR 最大的優勢就是在低數據速率下實現非常高效的編碼,與傳統的編碼技術不同的是,SBR 更像是一種後處理技術,因此解碼器的算法的優劣直接影響到音質的好壞。高頻實際上是由解碼器(播放器)產生的,SBR 編碼的數據更像是一種產生高頻的命令集,或者稱為指導性的訊號源,這有點 idi 的工作方式。我們可以看到,mp3PRO 其實是一種 mp3 訊號流和 SBR 訊號流的混合數據流編碼。有關資料顯示,SBR 技術可以改善低數據流量下的高頻音質,改善程度約為 30%,我們不管這個 30% 是如何得來的,但可以事先預知這種改善可以讓 64 kbps 的mp3 達到 128 kbps 的 mp3 的音質水平(註:在相同的編碼條件下,數據速率的提升和音質的提升不是成正比的,至少人耳聽覺上是這樣的),這和官方聲稱的 64 kbps 的 mp3PRO 可以媲美 128 kbps 的 mp3 的宣傳基本是吻合的。
6、WMA
WMA 就是 Windows Media Audio 編碼後的檔案格式,由微軟開發,WMA 針對的不是單機市場,是網路!競爭對手就是網路媒體市場中著名的 Real Networks。微軟聲稱,在只有 64 kbps 的碼率情況下,WMA 可以達到接近 CD 的音質。和以往的編碼不同,WMA 支援防複製功能,她支援通過 Windows Media Rights Manager 加入保護,可以限制播放時間和播放次數甚至於播放的機器等等。WMA 支援流技術,即一邊讀一邊播放,因此 WMA 可以很輕鬆的實現在線廣播,由於是微軟的傑作,因此,微軟在Windows 中加入了對 WMA 的支援,WMA 有著優秀的技術特徵,在微軟的大力推廣下,這種格式被越來越多的人所接受。
7、RA
RA 就是 RealAudio 格式,這是各位網蟲接觸得非常多的一種格式,大部分音樂網站的在線試聽都是採用了 RealAudio,這種格式完全針對的就是網路上的媒體市場,支援非常豐富的功能。最大的閃爍點就是這種格式可以根據聽眾的頻寬來控制自己的碼率,在保證流暢的前提下盡可能提高音質。RA 可以支援多種音頻編碼,包括 ATRAC3。和 WMA 一樣,RA 不但都支援邊讀邊放,也同樣支援使用特殊協議來隱匿檔案的真實網路地址,從而實現只在線播放而不提供下載的欣賞方式。這對唱片公司和唱片銷售公司很重要,在各方的大力推廣下,RA 和 WMA 是目前互聯網上,用於在線試聽最多的音頻媒體格式。
8、APE
APE 是 Monkey's Audio 提供的一種無損壓縮格式。Monkey's Audio 提供了 Winamp 的插件支援,因此這就意味著壓縮後的檔案不再是單純的壓縮格式,而是和 MP3 一樣可以播放的音頻檔案格式。這種格式的壓縮比遠低於其他格式,但能夠做到真正無損,因此獲得了不少發燒用戶的青睞。在現有不少無損壓縮方案種,APE 是一種有著突出性能的格式,令人滿意的壓縮比以及飛快的壓縮速度,成為了不少朋友私下交流發燒音樂的唯一選擇。
- Nov 18 Tue 2008 20:31
音頻視訊格式介紹
close
全站熱搜
留言列表