第一篇:讀貝葉斯公式在臨床醫學診斷中的應用后感
讀貝葉斯公式在臨床醫學診斷中的應用后感
我們還在學習理論知識,雖然離臨床越來越近了,但真實的是我們還沒有接觸臨床,因為理論知識還沒有學到足夠多支持我們去臨床,這個公式也是理論性很強,統計問題,概率問題。彩票也是概率,但是還是很難預測出下次出什么。對于醫學,臨床醫生接觸的都是患者,生命只有一次,我們必須慎重對待,這個公式統計了幾百個數據,是局部的統計,是非全面的統計。理論跟臨床的差距還是很大的,如果是用于治療后為了分析數據而做的統計,我支持,畢竟這也是一種方法,但是如果是用它統計的概率去實施治療,我不同意!也許他對其他領域做的貢獻很大,這個是他其他方面的應用。醫學上的應用還得是經得住考驗的,畢竟我們面對的是有生命的跟我們一樣有繼續活著的權利,我們沒有權利利用其進行自己的試驗
郭小輝201110203211級結合
第二篇:貝葉斯技術在反垃圾郵件中的應用研究
淘寶網減肥藥排行榜 易購網
貝葉斯技術研究及在反垃圾郵件系統中的應用
王鵬飛王騰
(浙江廣廈建設職業技術學院 信息與控制工程學院,浙江 東陽322100)
摘 要:貝葉斯方法在垃圾郵件處理上具有速度快、準確率高的優點,基于貝葉斯分類的垃圾郵件分類方法受到廣泛的關注。我們主要研究制約中文郵件過濾效果的中文分詞方法,比較基于統計的多種方法,并根據需要對其中幾種算法進行改進。關鍵詞:貝葉斯技術垃圾郵件分布式過濾協作更新
Research and Application of Bayesian in Anti-Spam systems
Wang PengfeiWang Teng
(Computer & electric engineering Institute, Guangsha College of Applied Construction Technology, Dongyang 322100)
Abstract:At present, Anti-Spam technique is a research hotspot in international academe.There into Bayesian has high speed and high nicety rate in dealing with junk mail, therefore Anti-Spam based on Bayesian has been widely paid attention.The emphases of text in carnets Chinese participial ways of restricting Chinese mail filtration effect, comparing multi-ways based on statistic and improves some arithmetic on demands.Keywords:Bayesian;Spam;Distributed filtering;Collaboration update引言
垃圾郵件目前己經成為世界各國共同面臨的棘手問題。安全廠商Sophos發布了一份報告,列出了2006年的12個垃圾郵件大國。美國是垃圾郵件第一大國,是全球22%的垃圾郵件的發源地。中國的垃圾郵件問題同樣不容樂觀。根據中國互聯網協會反垃圾郵件中心2006 年第二次反垃圾郵件調查報告的統計,中國互聯網用戶平均每周收到垃圾郵件數量為17.43封,占到了用戶接收郵件的61.99%。貝葉斯基本理論
貝葉斯統計源于英國學者貝葉斯撰寫發表(1763年)的一篇具有哲學性的論文:《An Essay Towards solving a problem in the doctrine of chances》,后來發展形成了貝葉斯學派。Stanford大學的 Sahami(1998)最早把Bayes方法用于到垃圾郵件過濾,取得了較好的效果。
2.1向量空間模型(Vector Space Model)
郵件是一個無結構的文本,需要把它表示成一個向量才能進行計算。一般采用向量空間模型來實現郵件向量化。
定義長度為l的詞匯表V?{w1,?,wj,?,wl},對于長度為m,由單詞(稱為一個Token)
即?中的分量表示詞匯表V的對應位置的單詞是否在d中出現。
收稿日期:2008-04-15
作者簡介:王鵬飛(1981-),男,安徽肥東人,碩士,教師,主要從事數據挖掘和無線網絡技術研究。?k順序組成的郵件d{w1,?,wm}定義一個向量??x1,?,xi,?,xj?,其中xi?{0,1當wi?d時,xi=1,否則xi=0。},2.2Naive Bayes公式
Naive Bayes郵件過濾算法是基于內容的垃圾郵件過濾方法中的一種簡單有效的法。它的原理是把一封郵件dx當作一份文本文件,來進行文本分類。
郵件dx屬于郵件類別集合cj中的一種,這里 C={Cspam,Clegit}
貝葉斯用于垃圾郵件過濾時,通過計算郵件dx屬于某個類別cj的概率P(cj|dx),對該郵件進行分類。計算公式如下:
P(c j | dx)?
P(cj)P(dx|cj)
P(dx)
j?1,2,...,|C|(公式1)
其中,P(cj)是類的先驗概率,P(dx|cj)是類條件概率。對同一封郵件,P(dx)不變。根據全概率公式有:
j?
1樸素貝葉斯中假設dx表示為特征集合(t1,t2,...,tn),n為特征個數,各特征之間相互獨立。則有:
P(dx|cj)?P(t1|cj)*P(t2|cj)*...*P(tn|cj)??P(ti|cj)(公式3)
i?1n
P(dx)??P(cj)P(dx|cj)
|C|
(公式2)
公式1重新表示為:
P(d x)
P(cj|dx)?
P(cj)?P(ti|cj)
i?1
n
(公式4)
Naive Bayes文本分類存在多種變形模型,如二元獨立模型(Binary Independence Model)、多項式模型(Multinomial Model)、泊松分布模型(Poisson Model)、負二元獨立模型(Negative Binary Model),其中多項式模型具有最佳的效果。
在訓練集上估計P(ti|cj)時,取訓練樣本中特征項ti的最大似然估計作為給定類別下的條件概率
P(ti|cj)即:
n cj
其中,ncj是類別cj的樣本中的特征項總出現次數,nti_cj是類別cj的樣本中特征項ti出現次數。為避免出現0概率,對其進行簡單的平滑處理,其中m是訓練樣本中不重復的特征向量的總數:公式5可重新表示為:
P(ti|cj)?
nti_cj
(公式5)
j
in cj
P(t|c)?
nti_cj?(公式6)
貝葉斯分類方法的優勢有:在效率上優于其他算法;占用的存儲空間少;易于收集最新的垃圾郵件特征;適合于作為個性化的過濾器等。
3隱馬爾可夫模型及其改進
3.1隱馬爾可夫模型
一個隱馬爾可夫模型是一組有限的狀態,其中的某一個狀態可以以一定的概率轉移到另外的狀態(終止狀態除外),而且在轉移時產生輸出,能產生的輸出是有限的,輸出也是以一定的概率產生的。它的形式化描述是HMM =< S,W,A,B,π>。應用在分詞問題中的隱馬爾可夫模型可以定義為:1)S 表示模型中的狀態,N 是其的狀態數。在分詞中,狀態就是統計得到的所有字,N為統計所得的總字數。所有獨立的字都屬于集合S,S={S1,S2,...,Sn}。2)對于任何的句子都可以用集合S中的N個狀態來表示,并定義qt為一個句子中第t個字,它可能是N個字中的任一個。對于具體的算法來說,要確切計算如下的概率,需要統計(q1=Si1,q2=Si2,qt=Sit),t?詞的最大長度。這在實際的應用中是不可行的,所以對條件概率的計算被縮短為只看當前的狀態和其前一個狀態(見公式a)。3)狀態轉移概率矩陣A={aij}。此矩陣中的各元素在分詞中表示為某一字向其它字轉移的概率,即當字A出現時,其他的字出現在A之后的概率見公式b。4)初始狀態分布矢量∏={∏i},在分詞中表示在t = 1時刻字為狀態Si的概率,即詞的第一個字為
Si的概率(見公式c)。5)在給定的模型下,根據已經確定的需要結合的字來確定后一個相鄰的字要不要
結合到此新詞中(見公式d)。公式a、b、c、d如下:
P(qt?1?Sj|(q1?Si1,q2?Si2?,qt?Sit))?P(qt?1?Sj|qt?Sit)
(a)
ai,j?P(qt?1?Sj|qt?Si)?
Num_of_word[Si,Sj]
?Num_of_word[S,S]
i
j
j?1
N
1?i?N,(b)
(c)
Num_of_Si_in_word_as_first_character
?i?P(q1?Si)?
Num_of_Si_appear
P(O|Model)?P[Si1,Si2,Sim|Model]?
?P[Si1]?P[Si2|Si1]?P[Si3|Si2]???P[Sim|Sim?1]
(d)
=?i1?ai1,i2?ai2,i3???aim?1,im
3.2改進的隱馬爾可夫模型
由于在隱馬爾可夫模型中,后一個字要不要與前面的字串組合成詞,此條件概率最終轉化為只與每個字的前一個字相關,在本文中把此鏈改進為與前兩個字相關,這樣準確性比HMM要高,但代價是在用n-gram算法的統計過程中,從原來的n=1,2變為n=1,2,3。后面將通過實驗來確定用哪種方法更合理。
改進HMM中的公式(a)為:
P(qt?1?Sj|(q1?Si1,q2?Si2?,qt?Sit))?P(qt?1?Sj|(qt?1?Sit?1,qt?Sit))
改進公式(b),(c)為:
ak,i,j?P(qt?1?Sj|(qt?1?Sk,qt?Si))?
Num_of_word[Sk,Si,Sj]
?Num_of_word[S,S,S]
k
i
j
j?1
N
?i?P(q1?Si1,q2?Si2)?
改進公式(d)為:
Num_of_word_beginning_with_Si1Si2
Num_of_Si1Si2
P(O|Model)?P[Si1,Si2,?,Sim|Model]
?P[Si1,Si2]?P[Si3|(Si1,Si2)]?P[Si4|(Si2,Si3)]???P[Sim|(Sim?2,Sim?1)]??i?ai1,i2,i3?ai2,i3,i4???aim?2,im?1,im結語
由于貝葉斯技術在英文郵件分類中已經取得了良好的效果,所以本文把研究的重點放在了貝葉斯技術應用研究上,目前還沒有公開的、公認的最有效的發垃圾方法,因此在本文中研究比較了基于隱馬爾可夫模型并進行了改進。
參考文獻:
[1] 雷杰,王明哲,孫德寶.基于貝葉斯網絡的特征分類器[J].情報指揮控制系統與仿真技術, 2001,(9).[2] 余東峰,孫兆林.基于貝葉斯網絡不確定推理的研究[J].微型電腦應用,2004,(8).[3] 馮楠,李敏強,寇紀淞,方德.基于貝葉斯網絡的軟件項目風險管理模型[J].計算機工程,2007,(7).[責任編輯:程 娟]
第三篇:索貝T2在婚慶后斯制作中的應用(本站推薦)
索貝T2在婚慶后斯制作中的應用
我做婚慶攝像和使用常規編輯軟件做婚慶影片的后期編輯近十年了,婚禮攝像是我的長項,因為拍攝方式、拍攝視角獨特,各種游動攝像,單機模仿多機位拍攝及仿搖臂拍攝運用的更是恰到好處,拍攝得如魚得水,順暢自如,在行業里較有知名度,再加上后期制作恰當的鏡頭組接及音樂字幕特技就使得影片相當漂亮了。
隨著婚慶業務數量的不斷遞增,工作量不斷加大,擺在我面前迫在眉睫的一個嚴重的問題就是:如何能夠更便捷快速高效而又富于創意地編輯婚慶影片。
多年來,在走訪我們北京婚慶行業和天津、上海、石家莊、廣州、重慶、成都等同行們的很多制作部,了解到婚禮影片的后期制作還是使用傳統常規的幾款編輯軟件,多數公司都是用一些模版制作我們行業里稱為“行活兒”的影片,就是幾套模版幾個片頭來回給所有的新人用,從影片的結構、清晰度來說,完全能滿足客戶的要求,對于有特殊制作要求的客戶,我們給做幾個小特技客戶也會非常滿意,但是缺乏創新。
我們婚慶公司要是想在激烈的市場競爭中取得更大的發展,如何在拍攝技法上尤其是婚禮影片的后期編輯制作上有新的突破,我認為,獨特的創意思想加上一款優秀的編輯軟件,至關重要!
有朋友問我,包括很多網站的論壇里也在熱烈的討論一個話題——影片的拍攝重要還是后期制作重要?!想想看,一個非常有創意思想非常到位的拍攝,沒有優秀的后期制作怎么能更完美的表現呢。而再好的后期制作設備技術和操作,編輯一個拍攝得一塌糊涂的影片素材也無計可施。在行業里,我主張和倡導:拍攝是第一次創作,后期編輯制作是第二次創作。攝像人員帶著后期制作編輯的思想進行拍攝,而后期制作人員可以理解拍攝的每個精彩鏡頭的意圖,兩次創作完美結合,影片就非常精彩了。
婚慶行業里有很多拍攝技術不錯、經驗豐富的攝像師,他們并不會操作電腦進行影片后期編輯制作,他們需要找朋友的公司或者專門的后期制作工作室來完成婚禮影片的編輯制作和刻盤的工作,但又怕自己的拍攝意圖得不到正確的體現,一連數天,花費很多時間盯在編輯機房.制作人員編一步盯一步,指指點點,煞費苦心。而很多工作室的后期制作人員在旺季忙的時候,也會扛著機器上陣拍攝,而由于拍攝經驗的不足和對攝像設備不盡詳細的操控和場地燈光變化的不及時反應,使影片拍攝得并不成功,所以我的另一個主張是:攝像師一定要掌握后期編輯制作的技術,后期編輯制作人員也要提高拍攝水準。
前期拍攝要帶有后期意識
這次我拍攝的婚禮規模比較大,客戶對影片拍攝和制作要求比較高,我們安排3個機位進行拍攝,我是其中的游動機位,而為了追求最好的拍攝效果和影片的可視性,我這個游動機位又要隨時根據婚禮的進展和程序,在不同的位置、不同的角度來拍攝,拍攝難度最大,比如新郎接新娘的過程中,新郎從車上下來,通過一條小巷才能到達新娘家叫門接親,那么這段路上,我會用跟隨法拍攝,設計的一組鏡頭是手持DV機在新郎前面倒著走,邊走邊拍;一組鏡頭是在道路的側面拍攝,讓新郎一行接親的隊伍在鏡頭里入畫出畫,接下一組鏡頭,接親隊伍斜后方背影,機位邊拍攝邊升高,仿搖臂效果,然后編輯的時候后面切換到新郎正面拍攝的機位,用近景表現新郎來接新娘的喜悅心情,在拍攝的時候,通常按下拍攝鍵拍攝再一關,就是一段素材,而移動跟蹤拍攝,經常使用長鏡頭連貫拍攝,一氣呵成。優秀的攝像師在拍攝的時候不但要帶著編輯的思想進行拍攝創作,同時還要和多機位拍攝時與搭檔的配合,再有就是剪輯式的拍攝,即每次啟動停止錄制按鈕就拍攝一段素材,當然,更精確的剪輯以及婚禮某環節用哪個機位,用哪一段素材,用多長時間,還要到電腦上精確來操作。而剪輯式的拍攝會大大減低后期編輯制作時的工作量,減短編輯耗費的時間和節省較多的存放素材的磁盤空間。
婚禮儀式我們采用兩個固定機位和一個游動機位的拍攝方式、因為婚禮儀式會場桌位比較多,桌子之間的距離較較小,不便于更多的游動。在舞臺的一邊一個游動的機位隨時變換位置及角度和高度來抓拍婚禮儀式中精彩的鏡頭。
在喝交杯酒的環節,婚禮司儀安排新人面對面深情地目視對方,一邊喝交杯酒同時旋轉720度,背景音樂漸起,氣泡機噴出的泡泡在舞臺上飄曳,新人旋轉著喝交杯酒的時候,主持人配樂詩朗般宏亮的聲音說:在千萬雙眼睛中,唯有你的眼眸最耀眼!最迷人!在千萬杯美酒中,唯有這交杯酒最淳厚,最香甜……,一個固定機位正面中景至特寫,一個固定機位全景,一個游動機位在舞臺上高機位俯拍,鏡頭里一對兒新人徐徐旋轉著,慢慢地引下那幸福的美酒。
美妙的瞬間記錄在DV里,在后期編輯制作上,多機位的婚禮儀式環節我們還是采用利用軟件多軌道來編輯多機位的方式,因為現在婚禮消費上,新人在攝像的花費數額上還很少有能力支付利用切換臺轉播車現場多機位錄制的費用,多數情況還是要靠后期編輯制作人員利用軟件的多軌道對位來實現多機位切換,婚禮儀式內容大多是采用一個不關機拍攝主機位的音頻.切換使用三臺機器的視頻素材。
婚禮后期制作創意無限
在后期制作上我選擇了索貝T2專業非編系統編輯婚禮影片,我覺得它能夠完全按照我的思路來很好的制作出我所想要的效果,非常適合我的需求。
啟動電腦,打開索貝T2編輯軟件,映入眼簾的是一個干凈整潔的界面,編輯區,素材區、各種按鈕、圖標布局都非常合理,軟件應用的按鈕設計為背光式的,視覺相當舒服,連接DV機采集拍攝的婚禮素材,節目編輯按鈕及快捷編輯按鈕圖標、打入點出點、播放、快進快退、幀進幀退等在軟件中設置的位置、大小、顏色等一目了然.采集非常方便,可以直接采集上時間線,采集完成就可以直接在線上編輯了,不需要去素材窗口查找,非常節約時間。在我不斷深入到軟件之中,又不斷有驚奇的發現。
編輯游標在軌道上隨鼠標的拖拽任意游動到需要編輯的位置,快速預覽搜索編輯素材,素材邊緣移動到游標等功能方便實用,能高速有效地進行編輯,點住鼠標,上下移動滾輪即可輕松將時間線放大縮小,無論是通覽影片全局還是精確到幀的細致入微編輯,就是一個字цц快!還可以點住右鍵拖拉來實現時間線的放大縮小和位置的移動,這使我拍攝的婚禮影片得以在最短的時間里剪輯和整理素材。
同樣,在編輯的過程中,我也是帶著拍攝的思想進行編輯的,我自己拍攝了一個移動機位,另兩位攝像的素材也交由我統一編輯,在拍攝中另兩為攝像是在整體影片規劃前提下也包含了自己拍攝創作內容的,后期編輯的時候一定要結合影片整體的結構,婚禮中接親、車隊、儀式中的鞠躬行禮、改口敬茶、交杯酒、倒香檳塔、點蠟燭臺等重要環節。編輯人員理解透攝像人員在不同婚禮環節運用的穿鑿附會手段。拍攝技法,在燭光環節不同光線色彩下是自動檔拍攝還是手動拍攝了,移動仿搖臂效果的運動鏡頭和固定機位不同景別鏡頭的組接,音樂的配合,色彩平衡的調整等等,都要考慮周全,結合后期編輯操作人員對軟件各功能的深透了解和熟練的操作,在編輯制作酌時候,就能夠
進行第二次的再創作。
習慣性地點了一下右鍵,刷!一排菜單列表整齊排列:特技編輯、增加特技、遮罩編輯、倒放、添加軌道……真爽呀!增加了幾條視頻軌道和音頻軌道,數了數,有擋16條視頻軌和6條音頻軌道;濾鏡、遮罩、色彩校正。多重畫中畫、左右聲道、音頻效果等等得心應手,多機位拍攝的婚禮后期制作尤為方便:有了這么多功能強大?;臃碌目旖莶藛?,鏡頭組接、特技特效。創意發揮應用就更是應用自如了。
把今天拍攝的新人婚禮重要環節DV片段和新人的婚紗照片編輯成兩首歌曲的卡啦OK—MTV吧,在這個編輯階段,我體驗到了索貝T2動態標題、字幕,邊框。底紋、裝飾、唱詞功能之強大,非同一般軟件所能比擬。就拿唱詞斷句來說吧,我在操作的時候把歌曲素材調到音頻軌,把一整段連續的歌詞字幕一次導入唱詞編輯,然后播放歌曲,一邊播放歌曲,一邊就隨著歌曲的節奏來給歌詞進行斷句,歌曲也聽完了,每句歌詞也相應對位了。
體驗了索貝T2編輯制作的過程,徹底打破了后期編輯制作艱苦耗時而勞累的觀念,不是么?!以往的多少年來,差不多要編輯一部象點樣兒的片子所用的時間長度通常是原始素材時間長度的三十到五十倍的時間,而今,幾個小時就可以輕松出色地編輯一個完整而富于創意的婚禮影片。曾經婚禮的影片基本都要在婚禮后的三五天最多不超過一周才能交片的歷史將一去不復返了。接單多的婚慶公司折攝量是非??捎^的,節省時間所創造的效益和創意編輯制作所帶來韻形象效益是每個婚慶公司所追求的,那么索貝T2無疑是實現這些效益的利器。
用索貝T2進行編輯工作,感受頗深,簡單明了的軟件界面不至于讓操作人員無從下手,每個功能基本都能拿起來就用,而且簡便、快捷;有效。感覺我要擁有索貝T2這么一套編輯系統單來做婚禮影片絕對是大材小用了,我平時還拍攝很多向大型企業聯歡晚會,企業的專題片、宣傳片,廣告片、企業、政府會議等;每月還有我拍攝的幾十條新聞在各電視臺播出,索貝T2的編輯能在我和多家電視臺合辦的系列綜合節目發揮更大的作用。因為是首次體驗式使用索貝T2進行編輯,對軟件深層的更多自定義數據設置及如何巧妙地綜合運用軟件的功能,還有一些發掘認知和探究的余地,一旦把這些內容了解透了,運用熟練了,在編輯任何節目申就能達到想出什么效果,就立刻用軟件熟練快速地實現,做到人與軟件合一的境界,那對我來說就更加如虎添翼了。