第一篇:“教學(xué)用音頻處理技術(shù)”學(xué)習(xí)心得
“教學(xué)用音頻處理技術(shù)”學(xué)習(xí)心得
不知不覺 “教學(xué)用音頻處理技術(shù)”已經(jīng)學(xué)完了,對(duì)于這門課程,我學(xué)到的東西還是蠻多的。從最初的一無所知,到現(xiàn)在的初見成效,其間付出了時(shí)間和心血,也從中感受到無窮的樂趣。
大學(xué)里接觸過“教學(xué)用音頻處理技術(shù)”,但現(xiàn)在已經(jīng)畢業(yè)這么久,該會(huì)的知識(shí)也忘記的差不多了。現(xiàn)在再次學(xué)習(xí)這么課程,覺得無比的親切,雖然作業(yè)完成的不是很好。通過學(xué)習(xí),我對(duì)“教學(xué)用音頻處理技術(shù)”有了進(jìn)一步的認(rèn)識(shí),知道了好多以前根本沒有接觸過的東西。就像一籠中之鳥見到了蔚藍(lán)的天空,小河里的一條小魚見到了大海。一點(diǎn)也不夸張,這只是心里的一些想法。
我們的作業(yè),其實(shí)就是一次藝術(shù)創(chuàng)作的過程,從構(gòu)思、選材到制作完成需要花費(fèi)時(shí)間和精力,而每天的上網(wǎng)時(shí)間是有限的,因?yàn)槲业恼n程比較多,所以只好下班后再進(jìn)行學(xué)習(xí)。聽自己做的“聲音”我被感動(dòng)了,很有成就感和自豪感。我并不是為自己驕傲,而是自己有了進(jìn)步,我知道,“教學(xué)用音頻處理技術(shù)”的知識(shí)是淵博的,我只是學(xué)了皮毛。
學(xué)習(xí)的過程就是一個(gè)提高的過程,只有不段地學(xué)習(xí)、不斷地總結(jié),才能不斷地提高。
第二篇:教學(xué)視頻處理技術(shù) 學(xué)習(xí)心得
教學(xué)視頻處理技術(shù)學(xué)習(xí)心得
相城實(shí)驗(yàn)中學(xué) 方艷玲
這次網(wǎng)上培訓(xùn),我選擇學(xué)習(xí)教學(xué)視頻處理技術(shù),帶著初學(xué)者的好奇,在接觸之前以為很難,因?yàn)檫@是個(gè)一比較專業(yè)的軟件處理技術(shù)。起初是為了完成任務(wù)的心態(tài)去學(xué)習(xí)它,但是深入學(xué)習(xí)了解之后,覺得教學(xué)視頻處理技術(shù)是一個(gè)非常有意思、值得學(xué)習(xí)的軟件。
通過這次視頻處理技術(shù)的學(xué)習(xí),彌補(bǔ)以往視頻處理技術(shù)知識(shí)的空缺。過去只會(huì)通過QQ影音等軟件對(duì)視頻、音樂進(jìn)行簡(jiǎn)單的剪輯,但對(duì)整個(gè)視頻畫面的剪輯還是第一次接觸,經(jīng)過這一段時(shí)間的學(xué)習(xí),收獲頗豐,希望接下來一段時(shí)間再接再厲,努力掌握好教學(xué)視頻入門處理技術(shù)。
在學(xué)習(xí)的過程中,我按照老師的教學(xué)視頻,從最基本的知識(shí)和最基礎(chǔ)的操作開始,一步一步按部就班的學(xué)習(xí),慢慢我開始入門了,開始掌握一些基本操作。對(duì)于比較復(fù)雜的知識(shí)塊,我就反復(fù)看老師的視頻資料,我會(huì)將比較復(fù)雜的地方做筆記,然后反復(fù)練習(xí),最后在經(jīng)過多次的實(shí)踐后也就自然掌握了。在對(duì)視頻教學(xué)處理技術(shù)不斷深入的學(xué)習(xí)后,也逐漸感覺到了這個(gè)軟件技術(shù)其實(shí)對(duì)我們的教學(xué)工作的幫助也挺大的。
教學(xué)視頻處理技術(shù)能對(duì)現(xiàn)有的視頻文件進(jìn)行處理,使其滿足自己的需要,通過學(xué)習(xí),我掌握了幾種小方法。它不僅可以將自己需要的的幾種視頻合并在一起,還能將自己不需要的視頻部分刪除掉,這樣子可以節(jié)約活動(dòng)中不必要 的時(shí)間。運(yùn)用電腦制作一些文件,可動(dòng)可靜,生動(dòng)活潑,使教學(xué)過程更加生動(dòng)、直觀、形象,吸引學(xué)生的注意力,提升學(xué)生參加活動(dòng)的興趣。現(xiàn)在課堂教學(xué)以學(xué)生為 主體視頻教學(xué)技術(shù)可以調(diào)動(dòng)學(xué)生的學(xué)習(xí)積極性,增加學(xué)生的學(xué)習(xí)興趣.讓學(xué)生被動(dòng)學(xué)轉(zhuǎn)化為主動(dòng)學(xué),愿意學(xué)。
現(xiàn)在,我已經(jīng)掌握了一些視頻的制作技巧,遇到困難,可以網(wǎng)上搜索教學(xué)視頻,然后反復(fù)練習(xí),熟能生巧。在今后的教學(xué)活動(dòng)會(huì)中有效的利用現(xiàn)代化資源,不僅可以創(chuàng)設(shè)情境,還能把枯燥的活動(dòng)變得生動(dòng)、有趣。讓孩子們?cè)谟淇斓臍夥罩兄鲃?dòng)學(xué)習(xí),使學(xué)習(xí)活動(dòng)達(dá)到最佳的效果。作為新時(shí)代的教師,應(yīng)該不斷的學(xué)習(xí)充電,學(xué)習(xí)掌握新的知識(shí)和技術(shù)。通過這次網(wǎng)上視頻處理軟件專題的學(xué)習(xí),我也讓對(duì)現(xiàn)代信息技術(shù)的強(qiáng)大功能深有體會(huì)。在學(xué)習(xí)的過程中收獲很多,在此感謝老師提供的豐富的學(xué)習(xí)資源和熱情的幫助。這次培訓(xùn)的經(jīng)歷我懂得了掌握電腦技巧,需要不斷地實(shí)踐。
第三篇:音頻制作學(xué)習(xí)心得
學(xué)習(xí)音頻軟件心得體會(huì)
潘
飛
今年暑假,我學(xué)習(xí)了數(shù)字音頻技術(shù),帶著初學(xué)者的好奇,在接觸之前以為很難,因?yàn)檫@是個(gè)一比較專業(yè)的軟件處理工具。起初是完成任務(wù)的心態(tài)去學(xué)習(xí)它,但是深入學(xué)習(xí)了解之后,覺得音頻軟件是一個(gè)非常有意思的軟件。
在學(xué)習(xí)的過程中,我會(huì)將比較復(fù)雜的地方做筆記,然后反復(fù)練習(xí)。音頻數(shù)字技術(shù)在今后的教學(xué)中對(duì)我們幫助太大。數(shù)字音頻編輯能對(duì)現(xiàn)有的音頻文件進(jìn)行處理,使其滿足自己的需要,通過學(xué)習(xí),我學(xué)會(huì)了幾個(gè)小方法方法。它不僅可以將自己需要的的幾首歌曲合并在一起,還能將自己不需要的歌曲部分刪除掉,這樣子可以節(jié)約活動(dòng)中不必要的時(shí)間。運(yùn)用電腦制作一些文件,可動(dòng)可靜,生動(dòng)活潑,使教學(xué)過程更加生動(dòng)、直觀、形象,吸引幼兒的注意力,提升幼兒參加活動(dòng)的興趣。現(xiàn)在課堂教學(xué)以幼兒為主體,音頻數(shù)字技術(shù)可以調(diào)動(dòng)幼兒的學(xué)習(xí)積極性,增加幼兒的學(xué)習(xí)興趣.讓幼兒被動(dòng)學(xué)轉(zhuǎn)化為主動(dòng)學(xué),愿意學(xué).。現(xiàn)在,我已經(jīng)掌握了一些數(shù)字音頻的編輯技巧,還學(xué)習(xí)了PPT、photoshop這兩個(gè)軟件,遇到困難,可以網(wǎng)上搜索答案,然后反復(fù)練習(xí),熟能生巧。在今后的教學(xué)活動(dòng)會(huì)中有效的利用現(xiàn)代化資源,不僅可以創(chuàng)設(shè)情境,還能把枯燥的活動(dòng)變得生動(dòng)、有趣。讓孩子們?cè)谟淇斓臍夥罩兄鲃?dòng)學(xué)習(xí),使活動(dòng)得到最有效的收獲。
作為新時(shí)代的青年教師的我們,更應(yīng)該不斷的學(xué)習(xí)充電。通過這個(gè)專題的學(xué)習(xí),我不由得對(duì)自己肅然起敬,對(duì)現(xiàn)代信息技術(shù)的好處深有體會(huì).。原來學(xué)習(xí)真的很重要!在學(xué)習(xí)的過程中會(huì)遇到很多困難,但只要不斷地實(shí)踐,掌握電腦技巧,就會(huì)覺得這些并不難相信做出的文件會(huì)越來越好,越來越實(shí)用。
第四篇:視頻會(huì)議中的各種音頻技術(shù)
視頻系統(tǒng)術(shù)語(yǔ)---音頻技術(shù)
音頻技術(shù)
視頻通訊過程是視頻和音頻的實(shí)時(shí)雙向完整通訊過程。在這個(gè)過程中我們?yōu)榱双@得高清晰視頻圖像,有時(shí)卻忽略了另外一個(gè)重要的過程——音頻通訊過程。如果我們?cè)谟^看高清晰視頻圖像的時(shí)候,不能得到一個(gè)更清晰、連續(xù)的音頻效果。那么這個(gè)過程實(shí)際上就沒有任何意義,所以其重要性甚至超過視頻。在傳統(tǒng)的視頻會(huì)議系統(tǒng)中音頻技術(shù)發(fā)展極其緩慢,原因在于目前應(yīng)用于視頻通訊的音頻編解碼壓縮標(biāo)準(zhǔn)都是為了保持傳輸時(shí)的低帶寬占用和較高的編解碼效率,從而將音頻信號(hào)的采樣頻率、采樣精度和采樣范圍指標(biāo)做了極大的降低,使得所能提供的音頻清晰度和還原性都有很大程度上的衰減。與用于存儲(chǔ)和回放非實(shí)時(shí)壓縮協(xié)議的標(biāo)準(zhǔn)(如OGG、MP3等)相比,音頻的保真度非常低。這樣就在某種程度上對(duì)現(xiàn)場(chǎng)聲音的還原達(dá)不到要求。目前傳統(tǒng)視頻通訊過程中主要采用的是G.711、G.722、G.721、G.728等音頻標(biāo)準(zhǔn),音頻寬度僅有50Hz-7KHz單聲道,而人耳所能感知的自然界的頻響能力可以達(dá)到20Hz-20KHz,因此,在對(duì)現(xiàn)場(chǎng)環(huán)境音的還原過程中過多的音頻信息的丟失造成了無法真實(shí)表現(xiàn)現(xiàn)場(chǎng)情況。所以在高清晰視頻通訊過程中我們勢(shì)必要有一種相輔助的音頻處理方式解決此問題。使整個(gè)高清晰通訊過程更去近于完美。
目前國(guó)際上對(duì)音頻處理技術(shù)上標(biāo)準(zhǔn)較多,在對(duì)下一代實(shí)時(shí)交互音頻處理上可以采用MPEG-1 Layer 2或AAC系列音頻,對(duì)選用標(biāo)準(zhǔn)的原則是,音頻頻響范圍要達(dá)到22KHz,這樣就幾乎可以覆蓋了人耳聽覺的全部范圍,甚至在高頻方面還有所超越,能夠使現(xiàn)場(chǎng)音頻得到真實(shí)自然的還原,并且在還原時(shí)可以采用雙聲道立體聲回放,使整個(gè)視頻通訊的聲音有更強(qiáng)的臨近感,達(dá)到CD級(jí)音質(zhì)。同時(shí)在對(duì)鏈路帶寬的適應(yīng)和編解碼效率上達(dá)到最佳。下面是各種音頻編碼標(biāo)準(zhǔn)的說明:
1G.711
類型:Audio
制定者:ITU-T
所需頻寬:64Kbps
特性:算法復(fù)雜度小,音質(zhì)一般
優(yōu)點(diǎn):算法復(fù)雜度低,壓縮比小(CD音質(zhì)>400kbps),編解碼延時(shí)最短(相對(duì)其它技術(shù))缺點(diǎn):占用的帶寬較高
備注:70年代CCITT公布的G.711 64kb/s脈沖編碼調(diào)制PCM。
2G.721
制定者:ITU-T
所需帶寬:32Kbps
音頻頻寬:3.4KHZ
特性:相對(duì)于PCMA和PCMU,其壓縮比較高,可以提供2:1的壓縮比。
優(yōu)點(diǎn):壓縮比大
缺點(diǎn):聲音質(zhì)量一般
備注:子帶ADPCM(SB-ADPCM)技術(shù)。G.721標(biāo)準(zhǔn)是一個(gè)代碼轉(zhuǎn)換系統(tǒng)。它使用ADPCM轉(zhuǎn)換技術(shù),實(shí)現(xiàn)64 kb/s A律或μ律PCM速率和32 kb/s速率之間的相互轉(zhuǎn)換。
3G.722
制定者:ITU-T
所需帶寬:64Kbps
音頻寬度:7KHZ
特性:G722能提供高保真的語(yǔ)音質(zhì)量
優(yōu)點(diǎn):音質(zhì)好
缺點(diǎn):帶寬要求高
備注:子帶ADPCM(SB-ADPCM)技術(shù)
4G.721
制定者:ITU-T
所需帶寬:32Kbps/24Kbps
音頻寬度:7KHZ
特性:可實(shí)現(xiàn)比G.722 編解碼器更低的比特率以及更大的壓縮。目標(biāo)是以大約一半的比特率實(shí)現(xiàn)G.722 大致相當(dāng)?shù)馁|(zhì)量。
優(yōu)點(diǎn):音質(zhì)好
缺點(diǎn):帶寬要求高
備注:目前大多用于電視會(huì)議系統(tǒng)。
5G.721附錄C
制定者:ITU-T
所需帶寬:48Kbps/32Kbps/4Kbps
音頻寬度:14KHZ
特性:采用自Polycom 的Siren?14 專利算法,與早先的寬頻帶音頻技術(shù)相比具有突破性的優(yōu)勢(shì),提供了低時(shí)延的14 kHz 超寬頻帶音頻,而碼率不到MPEG4 AAC-LD 替代編解碼器的一半,同時(shí)要求的運(yùn)算能力僅為十分之一到二十分之一,這樣就留出了更多的處理器周期來提高視頻質(zhì)量或者運(yùn)行因特網(wǎng)應(yīng)用程序,并且移動(dòng)設(shè)備上的電池續(xù)航時(shí)間也可延長(zhǎng)。
優(yōu)點(diǎn):音質(zhì)更為清晰,幾乎可與CD 音質(zhì)媲美,在視頻會(huì)議等應(yīng)用中可以降低聽者的疲勞程度。缺點(diǎn):是Polycom的專利技術(shù)。
備注:目前大多用于電視會(huì)議系統(tǒng)
6G.723(低碼率語(yǔ)音編碼算法)
制定者:ITU-T
所需帶寬:5.3Kbps/6.3Kbps
音頻寬度:3.4KHZ
特性:語(yǔ)音質(zhì)量接近良,帶寬要求低,高效實(shí)現(xiàn),便于多路擴(kuò)展,可利用C5402片內(nèi)16kRAM實(shí)現(xiàn)53coder。達(dá)到ITU-TG723要求的語(yǔ)音質(zhì)量,性能穩(wěn)定。可用于IP電話語(yǔ)音信源編碼或高效語(yǔ)音壓縮存儲(chǔ)。優(yōu)點(diǎn):碼率低,帶寬要求較小。并達(dá)到ITU-TG723要求的語(yǔ)音質(zhì)量,性能穩(wěn)定。
缺點(diǎn):聲音質(zhì)量一般
備注:G.723語(yǔ)音編碼器是一種用于多媒體通信,編碼速率為5.3kbits/s和6.3kbit/s的雙碼率編碼方案。G.723標(biāo)準(zhǔn)是國(guó)際電信聯(lián)盟(ITU)制定的多媒體通信標(biāo)準(zhǔn)中的一個(gè)組成部分,可以應(yīng)用于IP電話等系統(tǒng)中。其中,5.3kbits/s碼率編碼器采用多脈沖最大似然量化技術(shù)(MP-MLQ),6.3kbits/s碼率編碼器采用代數(shù)碼激勵(lì)線性預(yù)測(cè)技術(shù)。
7G.723.1(雙速率語(yǔ)音編碼算法)
制定者:ITU-T
所需帶寬:5.3Kbps(29)
音頻寬度:3.4KHZ
特性:能夠?qū)σ魳泛推渌纛l信號(hào)進(jìn)行壓縮和解壓縮,但它對(duì)語(yǔ)音信號(hào)來說是最優(yōu)的。G.723.1采用了執(zhí)行不連續(xù)傳輸?shù)撵o音壓縮,這就意味著在靜音期間的比特流中加入了人為的噪聲。除了預(yù)留帶寬之外,這種技術(shù)使發(fā)信機(jī)的調(diào)制解調(diào)器保持連續(xù)工作,并且避免了載波信號(hào)的時(shí)通時(shí)斷。
優(yōu)點(diǎn):碼率低,帶寬要求較小。并達(dá)到ITU-TG723要求的語(yǔ)音質(zhì)量,性能穩(wěn)定,避免了載波信號(hào)的時(shí)通時(shí)斷。缺點(diǎn):語(yǔ)音質(zhì)量一般
備注:G.723.1算法是ITU-T建議的應(yīng)用于低速率多媒體服務(wù)中語(yǔ)音或其它音頻信號(hào)的壓縮算法,其目標(biāo)應(yīng)用系統(tǒng)包括H.323、H.324等多媒體通信系統(tǒng)。目前該算法已成為IP電話系統(tǒng)中的必選算法之一。
8G.728
制定者:ITU-T
所需帶寬:16Kbps/8Kbps
音頻寬度:3.4KHZ
特性:用于IP電話、衛(wèi)星通信、語(yǔ)音存儲(chǔ)等多個(gè)領(lǐng)域。G.728是一種低時(shí)延編碼器,但它比其它的編碼器都復(fù)雜,這是因?yàn)樵诰幋a器中必須重復(fù)做50階LPC分析。G.728還采用了自適應(yīng)后置濾波器來提高其性能。優(yōu)點(diǎn):后向自適應(yīng),采用自適應(yīng)后置濾波器來提高其性能
缺點(diǎn):比其它的編碼器都復(fù)雜
備注:G.728 16kb/s短延時(shí)碼本激勵(lì)線性預(yù)測(cè)編碼(LD-CELP)。1996年ITU公布了G.728 8kb/s的CS-ACELP算法,可以用于IP電話、衛(wèi)星通信、語(yǔ)音存儲(chǔ)等多個(gè)領(lǐng)域。16 kbps G.728低時(shí)延碼激勵(lì)線性預(yù)測(cè)。G.728是低比特線性預(yù)測(cè)合成分析編碼器(G.729和G.723.1)和后向ADPCM編碼器的混合體。G.728是LD-CELP編碼器,它一次只處理5個(gè)樣點(diǎn)。對(duì)于低速率(56~128 kbps)的綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)可視電話,G.728是一種建議采用的語(yǔ)音編碼器。由于其后向自適應(yīng)特性,因此G.728是一種低時(shí)延編碼器,但它比其它的編碼器都復(fù)雜,這是因?yàn)樵诰幋a器中必須重復(fù)做50階LPC分析。G.728還采用了自適應(yīng)后置濾波器來提高其性能。
9G.729
制定者:ITU-T
所需帶寬:8Kbps
音頻寬度:3.4KHZ
特性:在良好的信道條件下要達(dá)到長(zhǎng)話質(zhì)量,在有隨機(jī)比特誤碼、發(fā)生幀丟失和多次轉(zhuǎn)接等情況下要有很好的穩(wěn)健性等。這種語(yǔ)音壓縮算法可以應(yīng)用在很廣泛的領(lǐng)域中,包括IP電話、無線通信、數(shù)字衛(wèi)星系統(tǒng)和數(shù)字專用線路。
G.729算法采用“共軛結(jié)構(gòu)代數(shù)碼本激勵(lì)線性預(yù)測(cè)編碼方案”(CS-ACELP)算法。這種算法綜合了波形編碼和參數(shù)編碼的優(yōu)點(diǎn),以自適應(yīng)預(yù)測(cè)編碼技術(shù)為基礎(chǔ),采用了矢量量化、合成分析和感覺加權(quán)等技術(shù)。
G.729編碼器是為低時(shí)延應(yīng)用設(shè)計(jì)的,它的幀長(zhǎng)只有10ms,處理時(shí)延也是10ms,再加上5ms的前視,這就使得G.729產(chǎn)生的點(diǎn)到點(diǎn)的時(shí)延為25ms,比特率為8 kbps。
優(yōu)點(diǎn):語(yǔ)音質(zhì)量良,應(yīng)用領(lǐng)域很廣泛,采用了矢量量化、合成分析和感覺加權(quán),提供了對(duì)幀丟失和分組丟失的隱藏處理機(jī)制。
缺點(diǎn):在處理隨機(jī)比特錯(cuò)誤方面性能不好。
備注:國(guó)際電信聯(lián)盟(ITU-T)于1995年11月正式通過了G.729。ITU-T建議G.729也被稱作“共軛結(jié)構(gòu)代數(shù)碼本激勵(lì)線性預(yù)測(cè)編碼方案”(CS-ACELP),它是當(dāng)前較新的一種語(yǔ)音壓縮標(biāo)準(zhǔn)。G.729是由美國(guó)、法國(guó)、日本和加拿大的幾家著名國(guó)際電信實(shí)體聯(lián)合開發(fā)的。
10G.729A
制定者:ITU-T
所需帶寬:8Kbps(34.4)
音頻寬度:3.4KHZ
特性:復(fù)雜性較G.729低,性能較G.729差。
優(yōu)點(diǎn):語(yǔ)音質(zhì)量良,降低了計(jì)算的復(fù)雜度以便于實(shí)時(shí)實(shí)現(xiàn),提供了對(duì)幀丟失和分組丟失的隱藏處理機(jī)制 缺點(diǎn):性能較G.729差
備注:96年ITU-T又制定了G.729的簡(jiǎn)化方案G.729A,主要降低了計(jì)算的復(fù)雜度以便于實(shí)時(shí)實(shí)現(xiàn),因此目前使用的都是G.729A。MPEG-1 audio layer 1
制定者:MPEG
所需帶寬:384kbps(壓縮4倍)
音頻寬度:
特性:編碼簡(jiǎn)單,用于數(shù)字盒式錄音磁帶,2聲道,VCD中使用的音頻壓縮方案就是MPEG-1層Ⅰ。
優(yōu)點(diǎn):壓縮方式相對(duì)時(shí)域壓縮技術(shù)而言要復(fù)雜得多,同時(shí)編碼效率、聲音質(zhì)量也大幅提高,編碼延時(shí)相應(yīng)增加。可以達(dá)到“完全透明”的聲音質(zhì)量(EBU音質(zhì)標(biāo)準(zhǔn))
缺點(diǎn):頻寬要求較高
備注:MPEG-1聲音壓縮編碼是國(guó)際上第一個(gè)高保真聲音數(shù)據(jù)壓縮的國(guó)際標(biāo)準(zhǔn),它分為三個(gè)層次:--層1(Layer 1):編碼簡(jiǎn)單,用于數(shù)字盒式錄音磁帶
--層2(Layer 2):算法復(fù)雜度中等,用于數(shù)字音頻廣播(DAB)和VCD等
--層3(Layer 3):編碼復(fù)雜,用于互聯(lián)網(wǎng)上的高質(zhì)量聲音的傳輸,如MP3音樂壓縮10倍
12MPEG-1 audio layer 2,即MP2
制定者:MPEG
所需帶寬:256~192kbps(壓縮6~8倍)
音頻寬度:
特性:算法復(fù)雜度中等,用于數(shù)字音頻廣播(DAB)和VCD等,2聲道,而MUSICAM由于其適當(dāng)?shù)膹?fù)雜程度和優(yōu)秀的聲音質(zhì)量,在數(shù)字演播室、DAB、DVB等數(shù)字節(jié)目的制作、交換、存儲(chǔ)、傳送中得到廣泛應(yīng)用。優(yōu)點(diǎn):壓縮方式相對(duì)時(shí)域壓縮技術(shù)而言要復(fù)雜得多,同時(shí)編碼效率、聲音質(zhì)量也大幅提高,編碼延時(shí)相應(yīng)增加。可以達(dá)到“完全透明”的聲音質(zhì)量(EBU音質(zhì)標(biāo)準(zhǔn))
缺點(diǎn):
備注:同MPEG-1 audio layer 1
13MPEG-1 audio layer 3(MP3)
制定者:MPEG
所需帶寬:128~112kbps(壓縮10~12倍)
音頻寬度:
特性:編碼復(fù)雜,用于互聯(lián)網(wǎng)上的高質(zhì)量聲音的傳輸,如MP3音樂壓縮10倍,2聲道。MP3是在綜合MUSICAM和ASPEC的優(yōu)點(diǎn)的基礎(chǔ)上提出的混合壓縮技術(shù),在當(dāng)時(shí)的技術(shù)條件下,MP3的復(fù)雜度顯得相對(duì)較高,編碼不利于實(shí)時(shí),但由于MP3在低碼率條件下高水準(zhǔn)的聲音質(zhì)量,使得它成為軟解壓及網(wǎng)絡(luò)廣播的寵兒。
優(yōu)點(diǎn):壓縮比高,適合用于互聯(lián)網(wǎng)上的傳播
缺點(diǎn):MP3在128KBitrate及以下時(shí),會(huì)出現(xiàn)明顯的高頻丟失
備注:同MPEG-1 audio layer 1
14MPEG-2 audio layer
制定者:MPEG
所需帶寬:與MPEG-1層1,層2,層3相同
音頻寬度:
特性:MPEG-2的聲音壓縮編碼采用與MPEG-1聲音相同的編譯碼器,層1, 層2和層3的結(jié)構(gòu)也相同,但它能支持5.1聲道和7.1聲道的環(huán)繞立體聲。
優(yōu)點(diǎn):支持5.1聲道和7.1聲道的環(huán)繞立體聲
缺點(diǎn):
備注:MPEG-2的聲音壓縮編碼采用與MPEG-1聲音相同的編譯碼器,層1, 層2和層3的結(jié)構(gòu)也相同,但它能支持5.1聲道和7.1聲道的環(huán)繞立體聲。
15AAC-LD(dvanced Audio Coding,先進(jìn)音頻編碼)
制定者:MPEG
所需帶寬:48-64 kbps
音頻寬度:22KHZ
特性:提供高質(zhì)量的低延時(shí)的音頻編碼標(biāo)準(zhǔn),以其20ms的算法延時(shí)提供更高的比特率和各種聲音信號(hào)的高質(zhì)量音頻。
缺點(diǎn):
備注:超寬帶編解碼器技術(shù)支持高達(dá)48KHz采樣率的語(yǔ)音傳輸,與傳統(tǒng)的窄帶與寬帶語(yǔ)音編解碼器相比大幅提高了音質(zhì)。該技術(shù)可提供接近CD音質(zhì)的音頻,數(shù)據(jù)速率高達(dá)48–64kbps,不僅提高了IP語(yǔ)音與視頻應(yīng)用的清晰度,而且支持電話音樂傳輸功能。高清語(yǔ)音通道支持更高的采樣率,配合音頻編解碼器的高保真音效,顯著豐富并擴(kuò)展了頻譜兩端的音質(zhì)范圍,有效改善了語(yǔ)音回響性能,提高了清晰度。
第五篇:數(shù)字媒體處理技術(shù)綜述及學(xué)習(xí)心得
數(shù)字媒體處理技術(shù)綜述及學(xué)習(xí)心得
1、引言
隨著Internet與數(shù)字媒體技術(shù)的飛速發(fā)展,信息安全問題日益突出,主要表現(xiàn)在數(shù)字媒體被非法復(fù)制、篡改、傳播與攻擊等。因此,數(shù)字媒體的版權(quán)保護(hù)與信息完整性保證已逐漸成為人們迫切需要解決的一個(gè)重要問題,數(shù)字水印技術(shù)就是在這種需求下迅速發(fā)展起來的。
數(shù)字水印是一類信息隱藏技術(shù),其基本思想是通過一定的算法將一些標(biāo)志性信息嵌入到公開信息中,以達(dá)到隱匿信息的目的。其在知識(shí)產(chǎn)權(quán)保護(hù)、保密通信與內(nèi)容鑒別等領(lǐng)域都具有廣泛的應(yīng)用價(jià)值。數(shù)字水印技術(shù)最初由Van Schyndel等人在1994年的ICIP會(huì)議上提出,他們針對(duì)灰度圖像提出了兩種向圖像最低有效位嵌入水印的算法。1996年在英國(guó)劍橋召開了信息隱藏領(lǐng)域的第一次學(xué)術(shù)研討會(huì),標(biāo)志著信息隱藏作為一個(gè)新學(xué)科的誕生。十多年來,數(shù)字水印技術(shù)得到了長(zhǎng)足的發(fā)展,在水印的嵌入和檢測(cè)方面,都取得了較多的成果。
目前,國(guó)際上劍橋大學(xué)、IBM研究中心、NEC美國(guó)研究所、麻省理工學(xué)院等都對(duì)數(shù)字水印進(jìn)行了深入的研究。國(guó)內(nèi)在數(shù)字水印方面的研究起步稍晚,但發(fā)展迅速。1999年12月召開了第一屆全國(guó)信息隱藏學(xué)術(shù)會(huì)議。2000年1月,由國(guó)家863計(jì)劃智能計(jì)算機(jī)專家組織展開了“數(shù)字水印技術(shù)學(xué)術(shù)研討會(huì)”,體現(xiàn)了我國(guó)對(duì)這一領(lǐng)域研究的高度重視。目前,國(guó)內(nèi)清華大學(xué)、北京大學(xué)、北京郵電大學(xué)、中科院自動(dòng)化所、浙江大學(xué)、國(guó)防科技大學(xué)等都在該領(lǐng)域取得了不菲的成果。
2、數(shù)字水印的研究現(xiàn)狀 2.1文本水印
文本水印就是將代表著作人身份的信息(水印)嵌入到電子出版物中,在產(chǎn)生版權(quán)糾紛時(shí)來驗(yàn)證版權(quán)的歸屬。其主要分為三大類:基于文檔結(jié)構(gòu)的水印方法、基于自然語(yǔ)言處理技術(shù)的水印方法、基于傳統(tǒng)圖像的水印方法。基于文檔結(jié)構(gòu)的各種水印方法都只是提留在文本的表層,無法抵抗對(duì)于文本結(jié)構(gòu)和格式的攻擊,簡(jiǎn)單的重新錄入攻擊就能使之失效,因此這些水印方法普遍存在魯棒性差的缺點(diǎn)。自然語(yǔ)言文本水印方法相對(duì)提高了抗攻擊的能力,但普遍存在容量不足的問題。基于傳統(tǒng)圖像的文本水印普遍存在魯棒性不高、操作復(fù)雜的缺點(diǎn)。2.2圖像水印
根據(jù)水印的實(shí)現(xiàn)過程,圖像水印算法可分為空域算法和變換域算法。空域算法是通過直接改變?cè)紙D像的像素值來嵌入水印,通常具有較快的速度,但魯棒性差,且水印容量也會(huì)受到限制;變換域算法是通過改變某些變換系數(shù)來嵌入水印,通常具有很好的魯棒性和不可見性。其實(shí)現(xiàn)一般是基于圖像變換,如DCT、DFT、DWT等。重點(diǎn)介紹一下變換域算法。2.2.1離散傅里葉變換(DFT)
該方法是利用圖像的DFT來嵌入信息。通信理論中調(diào)相信號(hào)的抗干擾能力比調(diào)幅信號(hào)的抗干擾能力強(qiáng),同樣在圖像中利用相位信息嵌入的水印也比用幅值信息嵌入的水印更穩(wěn)健。實(shí)驗(yàn)表明該方法的抗壓縮能力比較弱。2.2.2離散余弦變換(DCT)
DCT能把空間域的圖像轉(zhuǎn)換到變換域上進(jìn)行研究,從而能很容易了解到圖像的各空間頻域成分,進(jìn)行相應(yīng)處理。基于DCT的水印方法與基于DFT的水印方法相比有較好的魯棒性,但是無法做到對(duì)圖像信號(hào)內(nèi)容的自適應(yīng),因此往往會(huì)造成對(duì)圖像特征的明顯損害,不可感知性不是最佳。2.2.3離散小波變換(DWT)
DWT是一種時(shí)間-頻率信號(hào)的多分辨率分析方法,在時(shí)頻兩域都具有表征信號(hào)局部特征的能力。實(shí)驗(yàn)表明,與DFT、DCT變換相比較,基于DWT的水印算法的魯棒性最優(yōu),且與JPEG2000,MPEG4壓縮標(biāo)準(zhǔn)兼容,利用DWT產(chǎn)生的水印具有良好的視覺效果和抵抗多種攻擊的能力,且不可感知性最好。2.3音頻水印
音頻水印利用音頻文件的冗余信息和人耳聽覺系統(tǒng)的特點(diǎn)來嵌入水印,其可以保護(hù)聲音數(shù)字產(chǎn)品不被隨意復(fù)制和篡改,如CD唱片,廣播電臺(tái)的節(jié)目?jī)?nèi)容等。有學(xué)者提出了音頻水印的三種基本方法:擴(kuò)頻嵌入方法、回聲隱藏方法和相位編碼方法。2.4視頻水印
視頻水印是通過對(duì)視頻載體的時(shí)間和空間冗余來嵌入水印,其既不影響視頻質(zhì)量,又能達(dá)到保護(hù)節(jié)目制作者的合法權(quán)益和控制數(shù)字產(chǎn)品的復(fù)制。視頻水印從算法要求上同圖像水印有許多相似之處,但視頻水印也有一些獨(dú)特之處,如能夠在壓縮和未壓縮的格式下實(shí)時(shí)完成水印的檢測(cè),對(duì)MPEG壓縮、串謀攻擊、A/D和D/A轉(zhuǎn)換等都有較好的穩(wěn)健性。
3、數(shù)字水印算法
從水印嵌入方式的角度來看,數(shù)字水印算法主要分為兩大類:空間域水印算法和變換域水印算法。3.1基于空間域的水印算法
空間域的水印算法將水印信息直接嵌入在圖像的灰度值中,該算法大都是基于最不顯著位LSB(Least Significant Bit)方法。這種水印算法的特點(diǎn)是對(duì)水印的嵌入和提取簡(jiǎn)單、快速,嵌入的水印信息量大,但由于它位于圖像的LSB上,穩(wěn)健性較差,容易受到有損壓縮、量比、有噪信道傳輸?shù)挠绊憽1容^典型的空間域算法包括Schyndel算法和Patchwork算法等。Schyndel算法把一個(gè)密鑰輸入一個(gè)m序列發(fā)生器來產(chǎn)生水印信號(hào),然后將該序列重新排列成二維水印信號(hào),并按像素點(diǎn)逐一插入到原始圖像像素值的最低位。Patchwork算法處理對(duì)象為256個(gè)亮度級(jí)和線性量化的圖像且所有的亮度級(jí)的概率相等,圖像中的任一像素值與其余的像素值是不相關(guān)的。該算法首先隨機(jī)選取N對(duì)像素點(diǎn),然后通過增加像素對(duì)中一個(gè)點(diǎn)的亮度值,而相應(yīng)降低另一個(gè)點(diǎn)的亮度值的調(diào)整來隱藏信息。李旭東等人分析了現(xiàn)有的抗幾何攻擊算法的不足,并提出了一個(gè)新的抗幾何攻擊的圖像數(shù)字水印算法。該算法在水印嵌入時(shí),先對(duì)原始圖像進(jìn)行分塊,然后對(duì)各個(gè)子塊圖像根據(jù)量化策略重復(fù)嵌入相應(yīng)的1bit水印信息;在水印提取時(shí),先將含水印圖像進(jìn)行分塊,然后對(duì)從各個(gè)子塊圖像中提取出的水印信息根據(jù)多數(shù)原則判定相應(yīng)子塊圖像所含的1bit水印信息。3.2基于變換域的數(shù)字水印算法
基于變換域的水印算法是目前應(yīng)用最廣泛的方法,這種方法是將圖像變換到頻域中,然后通過改變某些頻域系數(shù)來嵌入水印。頻域中能量分布較集中,且圖像像素點(diǎn)間有一定的相關(guān)性,這有利于保證水印的不可見性,魯棒性好。常用的變換有:離散余弦變換(Discrete Cosine Transform,DCT)、離散傅立葉變換(Discrete Fourier Transform,DFT)、離散小波變換(Discrete Wavelet Transform,DWT)。Cox算法是典型的離散余弦變換水印算法,該算法首先計(jì)算圖像DCT系數(shù),然后選擇那些視覺重要部分的系數(shù)嵌入水印。文獻(xiàn)[6]首先把圖像分成8×8的不重疊像素塊,經(jīng)過分塊DCT變換后,得到由DCT系數(shù)組成的頻率塊,然后隨機(jī)選取一些頻率塊,將水印信號(hào)嵌入到由密鑰控制選擇的一些DCT系數(shù)中,其特點(diǎn)是數(shù)據(jù)改變幅度小,透明性好,但抵抗幾何變換等攻擊的能力弱。C.T.Hsu等人提出了基于可視化模型的算法,在8×8圖像塊的DCT系數(shù)中,選擇4×4個(gè)中頻系數(shù)組成小塊,通過比較相鄰兩個(gè)小中頻系數(shù)塊中相應(yīng)位置上系數(shù)的大小,進(jìn)行水印的嵌入,由于采用了可視化模型,提高了水印的不可見性。黃繼武等人利用人類視覺系統(tǒng)的照度掩蔽特性和紋理掩蔽特性,將空域中的圖像塊(8×8)分成三類,然后將不同強(qiáng)度的偽隨機(jī)序列的水印分量自適應(yīng)地嵌入到不同類圖像塊的DCT低頻系數(shù)中,實(shí)現(xiàn)水印的嵌入。肖俊等人將多級(jí)離散小波變換的“多級(jí)”思想引入到離散余弦變換中,并對(duì)多級(jí)離散余弦變換的特性進(jìn)行了分析,在此基礎(chǔ)上提出了一種基于多級(jí)離散余弦變換的數(shù)字水印算法,該算法從多級(jí)離散余弦變換系數(shù)中選擇適當(dāng)?shù)奈恢们度胨⌒畔ⅰkx散傅立葉變換可以很好地表達(dá)圖像的構(gòu)造分布,其平移、放縮和旋轉(zhuǎn)特性常常被用來構(gòu)造幾何變換的魯棒水印。V Solachdis等人構(gòu)造了一個(gè)環(huán)帶狀對(duì)稱水印,水印信息為(1,-1),將其嵌入到DFT的中頻子帶中,可以抵抗壓縮、旋轉(zhuǎn)、剪裁等操作。J.J.K.O.Ruanaidh等人在水印算法中使用Mellin-Fourier變換,將水印嵌入在只與傅立葉變換的振幅有關(guān)的子空間中。Jce Ruanaidh等人提出了一種基于相位調(diào)制的水印算法。赫明釗等人提出一種基于分?jǐn)?shù)傅里葉變換和隨機(jī)相位編碼的光學(xué)加密數(shù)字水印技術(shù),該數(shù)字水印技術(shù)對(duì)于噪音疊加和常見的圖像處理操作具有較強(qiáng)的穩(wěn)健性。
小波變換是一種比較特殊的變換方式,它具有多分辨率分析的特點(diǎn),而小波基和小波變換級(jí)數(shù)的選擇更是給小波變換域數(shù)字水印算法的設(shè)計(jì)帶來了很大的靈活性和優(yōu)越性。Hsu和Lwu提出了多分辨率分析的水印算法,首先對(duì)水印和原始圖像同時(shí)進(jìn)行多分辨率分析,然后將水印在分辨率下的分析系數(shù)嵌入到具有相應(yīng)分辨率的圖像塊中,這樣,即使含水印的圖像質(zhì)量受到了攻擊,丟失了部分信息,較低分辨率的水印仍然保存在較低分辨率的圖像塊中,因此水印具有較高的穩(wěn)健性。X.G.Xia等人選用滿足正態(tài)分布的偽隨機(jī)序列做水印,在整幅小波分解生成的圖像中,用由高分辨率到低分辨率、同一分辨率下由高頻到低頻逐個(gè)子帶添加水印的方法進(jìn)行嵌入。這種水印算法的優(yōu)點(diǎn)是水印檢測(cè)按子帶分級(jí)擴(kuò)充水印序列進(jìn)行,在水印圖像質(zhì)量破壞不大的情況下,水印檢測(cè)可以在搜索少數(shù)幾個(gè)子帶后終止,提高了水印檢測(cè)的效率。H.M.Wang等人在上述方法的基礎(chǔ)上進(jìn)一步利用漸進(jìn)編碼的思想進(jìn)行水印的嵌入和檢測(cè)。首先通過一定的閾值選擇一個(gè)小波分解的重要子帶,在子帶中從處于高位平面的系數(shù)到處于低位平面的系數(shù)上,添加水印直到所有水印點(diǎn)嵌入到圖像中,該算法給出了一種不使用原始圖像的盲檢測(cè)方案。Lu Jiang和ZhangRan采用基于2維離散小波變換的數(shù)字水印方法,可以在不影響圖像視覺效果的情況下,將水印信息嵌入到高通小波系數(shù)中,可以在一定程度上抵制壓縮攻擊和幾何攻擊。3.3基于融合的數(shù)字水印算法
圖像融合主要有兩種方式。一種是將兩幅圖像按照某種方式疊加生成一個(gè)新的圖像,使新圖像中包含兩個(gè)圖像的信息。采用較好的融合算法能保證恢復(fù)時(shí)無需原始公開圖像。另一種是利用數(shù)字圖像的自相關(guān)性,通過放大原始公開圖像來隱藏與公開圖像同樣大小的數(shù)字圖像。此方法對(duì)于彩色圖像的隱藏比較實(shí)用,尤其適用于BMP彩色圖像的加密隱藏,而且對(duì)所要隱藏的圖像進(jìn)行置亂處理后,安全性更高。
除了以上數(shù)字水印算法外,還有其他一些算法,比如分形水印、基于特征的水印算法等。
4、數(shù)字水印的應(yīng)用領(lǐng)域 4.1 版權(quán)保護(hù)
版權(quán)保護(hù)是數(shù)字水印的最主要應(yīng)用領(lǐng)域,其思想是數(shù)字作品的所有者通過密鑰產(chǎn)生水印,利用一定的嵌入方法,將水印嵌入原始數(shù)據(jù)(圖像、聲音、視頻等),然后公開發(fā)布嵌入水印的作品。當(dāng)該作品被盜版或出現(xiàn)版權(quán)糾紛時(shí),所有者可利用水印提取、檢測(cè)、驗(yàn)證等方法,使嵌入的水印成為鑒定、起訴非法侵權(quán)的證據(jù),從而保護(hù)所有者的權(quán)益。4.2 來源追蹤
為避免未經(jīng)授權(quán)的拷貝和發(fā)行,出品人可以將不同用戶的ID或序列號(hào)作為不同的水印(數(shù)字指紋)嵌入作品的合法拷貝中。如果發(fā)現(xiàn)未經(jīng)授權(quán)的拷貝,就可以根據(jù)此拷貝所恢復(fù)出的水印(數(shù)字指紋)來確定它的來源。4.3 信息標(biāo)注
數(shù)字作品具有很多屬性信息,如作品的標(biāo)題、創(chuàng)作者等,利用數(shù)字水印技術(shù)將這些信息嵌入到作品中,不但不需要額外的帶寬和存儲(chǔ),而且不易丟失。另外,國(guó)防和情報(bào)部門還可以利用數(shù)字水印技術(shù)實(shí)現(xiàn)隱蔽通信。4.4 訪問控制
利用數(shù)字水印技術(shù)可以將訪問控制信息嵌入到媒體中,在使用媒體之前通過檢測(cè)嵌入到其中的訪問控制信息,以達(dá)到訪問控制的目的,它要求水印具有很高的魯棒性。DVD防拷貝系統(tǒng)是訪問控制的一個(gè)典型的應(yīng)用例子,它將數(shù)字水印信息加入DVD數(shù)據(jù)中,并在DVD播放機(jī)中增加驗(yàn)證模塊,使用DVD播放機(jī)之前,可以事先檢測(cè)DVD數(shù)據(jù)中的水印信息來判斷其合法性和可拷貝性,從而保護(hù)制造商的商業(yè)利益。還可以通過計(jì)算使用次數(shù)和復(fù)制次數(shù)進(jìn)行控制,防止用戶無限制地復(fù)制使用。
4.5 認(rèn)證和完整性校驗(yàn)
認(rèn)證和完整性校驗(yàn)是為防止數(shù)據(jù)被非法篡改或偽造。通常采用脆弱水印,用惟一的與數(shù)據(jù)內(nèi)容相關(guān)的密鑰生成并嵌入水印。對(duì)嵌入水印的數(shù)字進(jìn)行檢驗(yàn)時(shí),再利用與數(shù)據(jù)內(nèi)容相關(guān)的密鑰提取出水印,然后通過檢驗(yàn)提取出的水印完整性來檢驗(yàn)作品的完整性。其優(yōu)點(diǎn)在于認(rèn)證同內(nèi)容密不可分,簡(jiǎn)化了處理過程。