第一篇:卡巴斯基實驗室成功獲得尖端反垃圾郵件技術專利
卡巴斯基實驗室成功獲得尖端反垃圾郵件技術專利
領先的信息安全解決方案提供商——卡巴斯基實驗室宣布,已經成功地在俄羅斯注冊了世界尖端的反垃圾郵件技術專利。該技術能夠有效、深入地檢測到圖片中的垃圾信息。
當今的反垃圾郵件過濾器對于檢測文本中的垃圾信息沒有什么困難,所以現在很多垃圾郵件散布者經常使用隱匿技術將垃圾信息藏于圖片中。而過濾圖片中的垃圾信息比過濾文本中的要遠遠復雜得多。在反垃圾郵件過濾器判斷一段文本中的信息是否為垃圾信息前,必須要能夠檢測到圖片中隱藏的文本信息。而大部分用于檢測圖片中文本信息的方法都依靠于機器識別圖片技術。但機器識別技術對于其中符號的大小、風格和布局都要求很高的統一性。垃圾郵件發布者正是利用機器識別技術這一局限性,故意在圖片中進行扭曲并制造“干擾”,從而使得識別變得更困難。
卡巴斯基實驗室該項領先技術能夠有效地識別和檢測光柵圖像中的文本和垃圾信息,而不需要機器識別圖片技術的輔助。該技術能實現高速檢測,并且能識別幾乎所有的文本語言。
卡巴斯基實驗室的這項新的反垃圾郵件技術由Eugene Smirnov研發,并于2009年1月13日獲得聯邦知識產權、專利及商標處頒發的專利。
這項新的專利技術基于概率和數理統計方法。一個圖片中是否包含文字信息,取決于圖片中的圖案的布局是否組成單詞和句子,以及這些字母和單詞組成的內容。專用的過濾器能夠保證系統不受圖片中干擾元素或者文本碎片的影響。而該技術中獨特的文本行識別方法又能夠有效地對付圖片垃圾郵件中使用的干擾技術,如圖形扭曲或者旋轉等。同時,新的反垃圾郵件系統還能夠通過比較其自身數據庫中的垃圾郵件模板,從而有效地判定檢測到的文本是否為垃圾信息。
卡巴斯基實驗室的反垃圾郵件研發組經理、該技術的研發人員Eugene Smirnov說:“一方面,這項新技術能有效地檢測圖片中包含的幾乎各種語言,另一方面,我們并沒有嘗試使用機器識別技術閱讀文本,因此這項技術有效地降低了對系統資源的要求,它被應用于卡巴斯基實驗室的高性能反垃圾郵件過濾模塊。”
卡巴斯基實驗室的專利法務組經理NadezhdaKashenko評論道:“該項發明對于反垃圾郵件產業非常重要。值得指出的是,雖然現在有很多不同的技術用于檢測垃圾文本信息,但能夠識別圖片中的垃圾文本信息的技術寥寥無幾。這些解決方案非常復雜和繁瑣,因為要想確認郵件是否為垃圾郵件,必須先要識別出圖片中的文字。Eugene Smirnov開發的技術非常獨特,是新一代的技術,所以我們有理由為其申請專利。”目前,卡巴斯基實驗室在美國和俄羅斯還有30多個專利申請正在等待通過,涉及一系列公司員工研發的技術。
眾所周知,當今的很多反病毒技術都是由卡巴斯基實驗室開發研究出來的,這些技術也被授權給許多廠商在世界范圍內廣泛使用,如微軟、Bluecoat, Juniper Networks, Clearswift, Borderware, Checkpoint, Sonicwall, Websense, LanDesk, Alt-N, ZyXEL, ASUS and D-Link。
來自統計調查公司艾瑞咨詢的最權威數據顯示,2010年,在人們日常收集到的垃圾郵件中,垃圾郵件發送者將廣告信息和文字信息以圖片的形式發送的郵件從2009年初所占比例的10%已經飆升至25%。這些專業的廣告郵件發送者越來越會隱蔽他們的這些廣告信息,以免這些廣告信息被反垃圾郵件網關過濾,他們以bmp,jpg,tiff,gif等不通的格式制成圖片,將這些圖片發送出去,取代以前的郵件文本格式。這些不同的圖像之所以能夠蒙蔽一些反垃圾郵件網關,是因為要解讀這些圖片需要占用服務器的大量CPU資源外,還要新的識別算法來讀取這些圖片,從加重郵件網關的負擔。從而造成一般的郵件網關不能很好地識別這些垃圾郵件,讓這些垃圾郵件發送者專了空子。這些圖像垃圾郵件除了給我們帶來了一般垃圾郵件的危害以外,同時也為圖片郵件比常規郵件文本內容更大,也更占用郵件服務器的存儲空間。
企業級郵件系統應用安全解決方案提供商梭子魚公司于2009年初第一個宣布:梭子魚反垃圾郵件網關將采用新的反垃圾郵件技術阻斷不斷增長的圖片型垃圾郵件,全新的圖片識別和圖像行為分析技術將重點解決這些圖片郵件。當前許多反垃圾郵件解決方案僅采用了基于文字內容評分的技術,因此圖片型垃圾郵件日益增長。這也將是梭子魚最近關注的重點。
“梭子魚反垃圾郵件網關的分層過濾機制能夠準確地過濾絕大部分的圖片垃圾郵件。”梭子魚公司市場產品經理副總StephenPao說,“即將推出的OCR和指紋識別技術向我們的用戶表明梭子魚公司將不斷地提升郵件反垃圾技術用以阻斷各種新型垃圾郵件。幫助我們用戶解決垃圾郵件的危害問題。“
通過接近一年的數據統計和數據觀察分析,梭子魚公司發現在垃圾郵件中有28%含有圖片,其中大部分圖片中又包含著文字等廣告信息。利用先進的OCR技術,梭子魚反垃圾郵件網關能夠識別這些圖片中的文字,并根據特定算法和規則予以相應的評分和判斷,再結合這封郵件的其他部分如信頭、信體的各種特征,最終判斷這封郵件是否是垃圾郵件,然后判斷是否該阻斷這封郵件。
此外,梭子魚還采用了新的技術,提取這些垃圾郵件包括圖片郵件中的指紋特征。然后梭子魚公司的反垃圾郵件中心通過世界各地的郵件蜜罐集群以及我們收集到的數萬梭子魚用戶的舉報來的垃圾郵件并予統計分析,形成特有的垃圾郵件指紋庫。梭子魚設備連接反垃圾郵件中心,時時下載和更新這些反垃圾郵件規則庫。采用新指紋分析技術分析郵件并與指紋庫中的數據進行比較,自動地阻斷、隔離、標記郵件這樣,指紋分析就能夠阻斷圖片垃圾郵件,即使圖片不包含文本。
OCR技術已在梭子魚反垃圾郵件網關的3.3.03以上版本中使用。新郵件指紋識別技術已經在梭子魚
3.4.04以上版本中使用。梭子魚的反垃圾郵件用戶無需為這兩種新的技術支付額外的費用,只要屆時聯網自動升級就可以使用這兩項技術。