本科畢業設計(論文)
工 作 手 冊
(理工類專業適用)
學 院
專業班級
姓 名
學 號
指導教師
二○一 年 月 日
基于形狀特征的圖像檢索算法仿真實現研究
摘要:近年來,隨著數字多媒體和移動計算機以及互聯網信息技術的快速進步發展,數字圖像的應用數量正以驚人的增長速度不斷增長。面對日益豐富的數字圖像媒體信息這個海洋,人們仍然需要有效地從中不斷獲取所有人期望能夠得到的更多媒體信息。因此,在一個大規模的數字圖像檢索數據庫中如何進行快速、準確的圖像檢索已經成為當前人們圖像研究的一個熱點。
為了能夠實現快速而準確地進行信息檢索數字圖像,利數字圖像的主要視覺信息特征,如圖像顏色、紋理、形狀等元素,基于形狀的數字圖像信息檢索處理技術應運而生。本文主要深入研究基于圖像形狀基本特征的邊緣圖像偵測檢索,邊緣圖像檢測檢索是基于圖像形狀基本特征的一種有效檢索圖像方法,邊緣檢測是檢索圖像最基本的形狀特性。在圖像景物邊緣特征檢測中,微分這個算子算法可以準確提取和輸出景物圖像的一些細節分析信息,景物圖像邊緣特征是圖像細節分析信息中最主要具有不可描述性的景物邊緣特征的部分,也是進行圖像邊緣分析過程中的一個不可或缺的部分。本文詳細地闡述分析了一種局部邊緣厚度檢測算子方法,即canny方法算子,用c++編程語言實現各方法算子的局部邊緣檢測,并根據算子邊緣厚度檢測的準確有效性和邊緣定位的準確可靠性,得出這種canny方法算子已經具備了所有最優化的邊緣厚度檢測所應必需的各種特性。并通過基于圖像輪廓的圖形描述表示方法,傅里葉輪廓描述符對一個圖像的輪廓形狀及其特征特點進行輪廓描述并將其存入圖像數據庫中。對行業也相應的具有檢索查詢功能。
關鍵詞:形狀特征檢索;邊緣圖像檢測;傅里葉描述符
一、前言
隨著現代信息化工業社會的到來,幾乎任何一個學科研究領域的技術發展都和現代計算機技術密切聯系有關,人們所需要處理的圖象信息已不僅僅只是一些數字、符號等的信息,而是越來越多地與人接觸并得到大量的數字圖象內容信息.其中例如:航空衛星信息遙感監測圖象、醫學遙感圖象、地理水文信息監測圖象等.而且在實際技術應用中隨著時間的不斷推移,圖象信息數量也在不斷擴大,利用各種人力來對這些圖象信息進行內容瀏覽和信息檢索,不僅僅需要大量的精力和時間,浪費大量的的人力,而且幾乎已是不可能完成的一件事。這樣需要利用計算機對這些數字圖象內容進行有效內容組織和信息檢索便已經成為現代人們科學研究的重要課題.因而傳統的數字圖象內容表達和信息檢索處理方法往往是需要使用圖象文件名、標題、關鍵詞數字等.目前,這種檢索方法已不能完全滿足現代人們的技術要求.因此,人們越來越迫切地認識需要對這些圖象的各種可視性和特征圖象進行信息提取,并且根據這些可視特征對各種圖象內容進行信息檢索.基于圖象內容的數字圖象信息檢索處理技術,也正是在這樣的一種情況下發展產生的.基于圖象內容的數據圖象信息檢索數據技術就是通過數據分析一個圖象的主要內容(例例如:顏色、紋理、形狀等),從大量活動視頻圖象庫中查找含有特定物體的圖象,它充分克服了現代傳統檢索方法的不足,融合了數字圖象處理、圖象識別和網絡圖象檢索數據庫等多個領域的最新技術成果,從而完全可以為你提供更有效的圖象檢索技術手段.它們既充分體現了特征圖象的基本信息處理特點,又充分結合了現代傳統圖象數據庫檢索技術.其基本檢索過程一般是:首先對一個圖象特征進行圖像預處理,然后根據特征圖象的基本內容從特征圖象中直接選取所有有需要的特征圖象形狀特征,存于圖象數據庫中;然后當對一個圖象特征進行勾畫檢索時,對于一個圖象已知的特征圖象首先抽取其具有相應的圖象特征,然后在整個圖象數據庫中進行檢索與其相似的特征圖象,也或者可以根據相對于某一個的查詢對象要求直接給出一些圖象特征點和值,然后根據所需要給定的圖象特征點和值在整個圖象數據庫中進行檢索所要的特征圖象.結果例如:對于基本相同形狀帶有特征的圖象檢索,你或許可以直接給出一些有關被勾畫檢索某個對象的基本形狀特征描述,可以認為是一些帶有特征點的值,也或者可以認為是勾畫出的檢索對象的形狀略圖;對于基本相同顏色的圖象檢過,可以直接給出不同顏色的物體比例或者關系,等等.最后,給出圖象檢索后的結果.目前,從事這一技術課題相關研究的年輕人越來越多,國外許多著名科研機構和專家學者都在積極進行許多有關這一技術課題的相關研究,例如:公司的數據檢索系統.國內的許多專家學者和相關科研機構也在積極進行此技術問題的相關研究.本文首先對基于對象內容實體圖象的的檢索數據進行了簡要的理論概括,然后對基于實體對象動態形狀的實體圖象內容檢索數據理論基礎進行了深入的理論研究,包括:基于對象形狀的實體圖象內容檢索計算方法,對象實體形狀的綜合描述,圖象形狀配匹檢索算法,最后本文給出了一個基于對象形狀的實體圖象內容檢索數據原型管理系統,并在一臺微機上加以實現,該原型系統主要功能包括內容圖象檢索數據庫的管理建立,數據庫的日常維護,圖象的信息查詢等幾個功能.二、研究介紹
2.1、課題背景及研究意義
隨著現代多媒體網絡技術、計算機網絡技術、通信網絡技術及互聯網絡的迅速進步發展,人們正在快速地發展進入一個現代信息化的新社會。現代信息技術已不可能能夠運用各種技術手段大量的進行采集和分析產生各種類型的海量多媒體信息數據,人們對各種多媒體信息的采集需求也越來越大量和頻繁。雖然人類信息的數量快速增長直接促進了人類社會的快速發展,但是由于信息快速膨脹也給現代人類社會帶來了過多的的信息量以至于遠遠超過了這類人的整體接受信息能力。因此,除了怎樣獲取、處理和傳輸存儲各種多媒體信息十分重要,怎樣在各類海量的各種多媒體信息中快速有效地準確訪問這些人們經常感興趣的各種多媒體信息也對其顯示體現出了同樣的巨大重要性。
圖像抽象信息采集是傳統多媒體信息中最常見的一種,也因其具有傳統多媒體信息采集數據量大、抽象應用程度低的基本特點。如何從各種海量的有用圖像處理信息中有效地收集獲取有用圖像信息,即使是圖像處理信息數據資源的使用管理和信息檢索也就顯得日益重要。隨著當前人們對文字圖像文本信息的巨大檢索需求的不斷增長,產生了基于圖像文本的文字圖像信息檢索引擎技術,比如著名的中文搜索結果引擎google和百度中對文字圖像的文本檢索。這種基于人類文本的人工檢索標注技術所廣泛利用的人工文本標注檢索方法雖然存在一些局限性,經常進行檢索時會出來大量的一些用戶不感興趣的文本圖像,但在沒有找到更好文本解決辦法的實際情況下,用戶通常只能選擇繼續檢索使用。因此如何對一個圖像的特征內容自動、客觀、全面地對其進行特征提取。真實有效的準確表示數字圖像信息內容,幫助用戶快速有效地檢索訪問自己感興趣的信息圖像內容,有著極大的科學研究領域需求和迫切的應用需要,而基于圖像形狀特征的數字圖像信息檢索分析技術恰好真正能有效的幫助解決這個現實問題。另外在實際的應用中,圖像信息數據庫及其信息檢索的技術研究對醫學多媒體圖像數字圖書館、醫學臨床圖像應用管理、衛星圖像遙感網絡圖像和應用計算機圖像輔助設計和開發制造、地理位置信息采集系統、犯罪識別系統、商標標識版權的使用管理,生物的形態辨識以及分類等諸多方面可以提供有力的技術支持。
2.2、國內外發展狀況
近年來,CBIR已經逐漸發展早熟成為一個非常活躍的醫藥臨床醫學研究應用領域,各類我國頂尖臨床科研機構與臨床研究公司已陸續成功開發推出了一些基于CBIR臨床應用管理系統的臨床研究應用產品,有的已經成功廣泛應用擴大到醫藥臨床醫學、商標、專利技術以及檢索等諸多研究領域。
IBM的系統QBIC是它是第一個具有商業性的基于CBIR的子系統。它們還提供了基于圖像顏色、紋理、形狀和其他手繪圖像草圖的多種圖像類型索引使用方法。columbia大學的圖庫Visual SEEK圖庫提供了基于自然色彩和立體紋理的多種索引分析方法。PhotoBook 是美國麻省理工學院和多媒體科學實驗室自主開發的一套用于檢索、瀏覽人臉圖像的交互式檢索工具,它其中包含三個圖像子系統分別用于提取人臉形狀、紋理和各種人臉面部特征,用戶甚至可以分別定制做基于上述一種人臉特征的圖像檢索。MARS(multimedia analysis and retrieval system)這個系統由美國UIUC 大學負責開發,其不同之處主要在于用戶學到了很多專業領域的基礎知識:例如計算機圖像視覺、數據庫資源管理和云系統和網絡信息資源檢索。新加坡國立大學公司開發的一個基于復雜內容的模糊圖像信息檢索系統,其顯著性的技術創新特色主要包括:多種特征提取的新方法、多種基于復雜內容圖像檢索的新方法、使用自定義組織式的神經網絡對復雜內容特征進行度量、建立基于各種內容圖像索引的新應用方法以及對各種多媒體信息格式進行模糊圖像檢索的新應用技術。
清華大學的數字ImgRetr檢索結合了多種組織檢索方法,就這樣能為您提供基于形狀主色、紋理、直方結構圖、顏色元素分布、框架等多種組織方式的形狀檢索。
2.3課題研究的主要內容
本文主要依托基于物體形狀的網絡圖像信息檢索分析技術,重點深入研究基于物體形狀動態特征的網絡圖像信息檢索。形狀紋理特征不同于物體顏色、紋理等的特征,形狀紋理特征的正確表達必須以對物體圖像中每個物體或圖像區域的正確劃分來作為理論基礎。在二維矩形圖像中的空間中,形狀通常被我們認為為它是由于一條完全封閉的并由輪廓映射曲線所形成包圍的特征區域。通常這種情況下.二維形狀中的特征區域有兩類可以表示它的方法,一類可以是一個區域形狀特征,利用的可以是整個二維形狀特征區域;另一種分類可以是一條輪廓曲線特征,利用的則可以是二維圖像的整個外邊和內界。本文主要重點研究的領域就是外界與邊界的邊緣索引測量方法邊緣測量檢測,邊緣測量檢測的常用方法主要有很多,如:roberts矩形交叉曲線微分代數算子、sobelt微分代數算子、priwitt交叉微分代數算子和Laplacian微分代數算子以及canny微分算子。而其中屬Canny算子最好。
本文主要深入研究的字符是傅里葉描述符。其主要理論思想觀點是用關于物體內部邊界的傅立葉變換公式作為其物體形狀學的描述。
2.4、相關內容介紹
2.4.1形狀分析
2.4.1.1、形狀特征
常用的長軸形狀運動特征參數有長軸周長、形狀特征參數、偏心率、長軸運動方向與彎曲運動能量等矩陣的描述、綜合光密度以及三維輪廓的應力矩也同樣可以用于表示和用來描述三維圖像。
2.4.1.2特征選擇
通常一般來說,形狀的形態表示特征圖型表示法具有兩種常用圖形表示法的表現方法,一種表示方式主要是用來表示具有輪廓性的形狀形態特征,另一種表示方法主要是用來表示具有區域性的形狀形態特征的。前者一般來說只用于看到整個部件物體的內部外觀和形狀邊界,而后者則直接把它關系著其應用到整個部件物體外觀形狀上的各個區域。
2.4.2、一種基于形狀的圖像檢索算法
2.4.2.1、算法分析
基于這種形狀的圖像檢索更多地只是用于了解當前的用戶能夠粗略地掃描畫出一個圖形輪廓之后進行圖形檢索的實際情況。這種圖形輪廓繪圖可以認為是通過用戶憑借自己腦子在空中的第一印象徒手自動畫圖繪出來的,也甚至可以認為是通過操作系統軟件提供的基本圖形繪圖處理工具“拼湊”的。這兩種檢索情況都不具有一個基本特點,即它所提供的檢索形狀只是對所欲檢索圖象形狀的粗略抽象描述,它從它的大小、方向或者其整體形狀結構上都很有可能與真正根據要求調查的檢索圖形形狀有較大小的出入。因此,基于面的形狀進行檢索的主要難點仍然在于需要尋找一種能夠準確檢索與面的大小、方向及整個扭曲面的伸縮程度無關的檢索方法。
不變矩和產品輪廓的應力不變矩的方法產品具有良好的軸向平移、旋轉、尺度上的縮小和放不變性及高度抗干擾性。用一個圖像的形狀不變矩和圖像輪廓的應力矩陣來作為矩對圖像的兩種形狀相似特征進行索引,使用適當的形狀相似性之間距離進行定義,計算并得出兩幅畫中圖像的形狀相似性之間距離,當這個距離的值足夠小時,就可以認為兩幅畫的圖像形狀是相似的。傅里葉這種算法不僅對圖像噪音控制具有很好的魯棒性,而且對幾何變換速度具有不變性,更加十分適合工圖像形狀分析檢索的實際需要。因此,提出了應力不變矩和矩形輪廓的應力不變矩的算法和傅里葉公式描述中的符號相結合的計算方法。
三、圖像檢索技術的發展過程
目前圖像檢索的技術最早開始于上個世紀70年代,當時主要研究的是基于文本的檢索,即使采用關鍵詞和描述性的文本來對其進行檢索,要求使用者對文本中各種特征的描述都必須具備一定的精度準確性和規范性。但是隨著各種大規模的數字化圖像倉庫的誕生,基于文本檢索的技術暴露了自身的優勢。在我國逐步發展到90年代,基于圖像內容的信息化圖像檢索技術應運而生,其設計思路主要是充分利用信息化圖像自身的各種視覺特點,例如:將圖像中的顏色、紋理結構、形狀、空間之間的關系等信息作為內容來進行匹配、查找。它通過充分地利用了己經擁有的算法,使得所有的特征提取和匹配都完全能夠由機器自動地完成,檢索的過程也沒必要太多的人為干涉和解釋,這就克服了傳統的手工標簽注釋方式的低效率和二義性。
四、基于形狀特征的圖像檢索
因為許多的圖像檢索系統把注意力集中到了基于色彩或者是紋理學的方式上。但對于某些圖像形狀來說,紋理和顏色的信息不夠豐富,如一些商標圖像等,這時基于紋理的檢索方法便無法完全滿足所有的檢索要求,而必須從整個圖像形狀入手。形狀特征信息是圖像的中心特征之一,圖像中的形態和信息不會隨著圖像中物體顏色的改變而發生任何變化,它是一種穩定的特征。用各種形狀的特征來區別物體很加直觀,它們是現代社會中人們識別不同形態圖像的主要技術特征之一。因此,通過利用各種形狀特征來檢索圖像,可以大大提高檢索的精度和效果。基于目標的形狀特征的圖像檢索主要目的是通過檢測得到目標輪廓線或分割得到目標輪廓,并針對其所在位置進行形狀特征的提取或直接針對圖像搜集尋找合適的向量特征。形態描述要求我們在盡量區別各個目標之間的基礎上,對于目標平移、轉動及尺度的變化并不敏感。目前,雖然我們已經研究提出了許多關于形狀的分析技術,但是想要將它們有效運用到圖像檢索中仍存在的問題還有一些困難和疑惑亟待解決,如算法的工作效率和復雜程度,形狀特征的提取與描述等。
五、基于形狀特征的圖像檢索具體實行
5.1對象形狀的描述
圖象經過邊緣的提取、分割后可以獲得諸個被分割的區域.對諸個被分割的區域所提取的形狀特征,是基于內容的圖象檢索系統的重要組成部分,所提取的形狀特征對于圖象的旋轉、圖像的平移和對圖象縮放都是不敏感的.本文主要研究涉及以下幾種形狀的特征:
(1)基于傅立葉系數的形態和特點.圓角度,細長程,散射性.(2)基于幾何形狀的特征.區域的面積,區域的周長,體態比.(3)矩描述.共有七個矩常量.(4)以相似多邊形為基礎的結構和特點.(5)形狀直方圖.5.2、系統設計與實現
系統主要可以分為三個組成部分:(1)圖象數據庫建立模塊.該建立模塊首先對用戶輸入的各種圖象信息進行了預處理,其中包括各種圖象信號和噪聲的清除,圖象尖銳化,邊緣檢測(對象物的分離),邊緣細化,鏈碼追溯,對于邊界信息進行了多邊形逼近,然后將其提取到對象的各種形狀信息,最后把用戶需要提取的信息特征值直接存入到圖象數據庫中;(2)圖像數據庫維護系統模塊.本次維護系統主要負責對圖像數據庫信息進行維護,主要內容包括圖像瀏覽記錄的修改及歷史紀念信息的刪除;在對圖像記錄進行修改時,對那些由于計算機自動提取得到的特征值我們都是不可以進行修改的,而且我們只能通過修改這些由人為確定定義的字段,如:一個有關于圖象的文字說明部分.(3)圖像檢索查詢模塊.該功能首先根據需要對被檢索的圖像進行提取的形狀和特征,然后再根據需要選擇按哪些特征值對象來進行檢索,設置好圖像的檢索所達到要求的類型和相似程度,最后與將圖像信息與數據庫中的其他圖像進行匹配,輸出查詢結果.圖象的匹配查詢是整個圖像信息數據庫的主要功能和組成部分,匹配算法的好壞及其優劣直接影響到匹配查詢的速度和信息庫查詢的質量,其根本思路就是通過判斷一個經典的已知圖象與一個圖像數據庫中的一個圖象之間的距離,如其距離有點足夠小,就說明我們可以確定兩個已知圖象之間是相似的,其結果一般應該是多個已知圖象,這些所有的圖象都與經典查詢的圖像在一個給我們認為有點相似.我們其實可以通過運用各種相似性程量測度查詢函數過程方法工具來進行分析和控制計算一個查詢特征圖象與一個特征圖像數據庫中每一個特征圖象的相似度和程度,相似性程度測量中的查詢函數過程主要來說是研究建立在對數據特征分析和模式識別相關技術研究基礎上的,涉及所遇到的主要技術問題之一就是對于一個數據輸入模式如何進行特征描述和模式判別,查詢的基本過程就是根據一個新的給定數據模式對一個數據輸入中的模式特征進行數據匹配.這個相似度一般來說是通過0~1之間的某個個不同參數特征來進行表現計算出來的,總的相似度也由各種不同特征所測量的相似度通過函數加權運算求和得.傳統數據庫的準確匹配和查詢技術是很簡單地了解的,但對于圖象型的數據庫來說,查詢的質量和查詢的快慢還是相互矛盾的,要求查詢率和準確性好,就需要盡可能多地增加一些描述圖象的特征矢量的維數,隨之而來就需要盡可能多地增加計算量,所以,要在不降低特征矢量的維數條件下,才能夠大幅度地提高查詢率,就必須通過調整和完善查詢的策略.主要采用以下兩種操作方法:
(1).聚類的基本原理:分類即把一個標準圖象按類劃分開來成以下幾類,每一類都被用戶定義成作為一個分類標準圖,則在用戶查詢一個標準圖象時,首先根據要求計算出與各種分類標準圖之間的物理距離,確定它們之間是否隸屬于何一類,然后再與該一類的標準圖象之間進行具有相似性的分類匹配.(2)過濾的原理:即通過降低維數,在進行圖象匹配之前,首先將一些形狀和特征相差甚遠的圖像從一個被稱為圖象匹配團隊中全部清除掉,然后再將查詢到的圖象和匹配團隊中剩下的其他圖象進行對比.5.3、算法步驟
(1)通過計算被檢索圖像的形狀和特征,并從數據庫中提取圖像形狀和特征進行索引;
(2)對特征向量進行歸一化;
(3)使用歐式距離法來計算歸一化后的圖像數據庫中各個圖像與顯示者的圖像之間的相似性和距離;
(4)按序輸出檢索結果。
5.4.邊緣檢測
其中邊緣化的特點通常是直接影響物體圖像最為主要的一個基本特點。邊緣則主要是在泛指周圍各個像素的顏色灰度并沒具有較大階躍性質的變化或者在屋頂上的顏色沒有發生較大改變的那一個周圍像素。Poggio在文中這樣解釋說:“或許對應著圖像中物體的邊界或許并沒有對應著圖像中物體的邊界,但是邊緣具有十分令人滿意的性質它能大大地減少所要處理的信息但是又保留了圖像中物體的形狀信息”。
邊緣圖像檢查理論是一種實現圖像識別的重要理論知識基礎和技術前提,直接意義地說它決定了圖像識別檢查結果的客觀準確性。由于人體邊緣圖像檢測尚不成熟,直接地嚴重影響了對圖像識別的實際研究應用,一直以來都認為是圖像識別相關技術應用領域的重要研究發展熱點。經過多年的研究探索和應用實踐,邊緣式質量檢測系統技術已經逐漸發展滲透至各個應用領域。在應用生物醫學上,邊緣提取檢測主要作為適用于人體腎臟血小球的邊緣提取,在應用生物醫學工業和工程科學以及其他工程材料領域的邊緣檢測,如聚酯纖維或者其他塑料制品。而且在加工噴涂、焊接和機械裝配時也被充分地吸收利用。在中國傳統的民族文化工藝美術上,用于對傳統紡織品和手工藝品的定制設計,服飾的定制設計和手工制作,發型的定制設計,文物收藏材料以及照片的編輯復制和收集整理,運動員的身體動作狀態分析和體能評級等等。總之,邊緣厚度檢測已被廣泛應用于各個領域。這仍然是我們必須不容忽視的一個研究發展熱點。
5.5、Canny邊緣檢測
5.5.1 Canny指標
基于微分算子的邊緣提取方法存在的一個比較麻煩的問題是如何讓我們選擇適當的閾值,可以通過這種方法使邊緣從每一個細節中被提取出來。閾值的選擇方式不同,所需要提取得到的邊界信息也不相同。在兩個不同的閾值下,采用相同的微分算子均可以從圖像邊緣提取得出一個點,但兩者之間有比較大的差異。這樣,在邊緣提取中也就存在了對提取良好與否的評估。
針對這一重要問題,根據邊緣檢測的工作有效性和其定位的安全可靠性, Canny 通過研究最優的邊緣檢測儀器所必須要求的特點,給出了衡量邊緣檢測系統性能好壞的三個主要指標:
(1)良好的邊緣信噪聲對比,即將不是邊緣點錯誤判定為其他邊緣點的錯誤概率相對較高,將其他邊緣點錯誤判定為其他邊緣點的錯誤概率相對較低;
(2)良好的定位特性,即檢測出來的邊緣點應該要盡量安裝在實際邊緣的點為中心;
(3)對于單個邊緣只能產生唯一的響應,即單個邊緣能夠同時產生許多個響應,其概率相對較低,并且在虛假的響應中對邊界的反饋效果相應得到最佳抑制.用這樣一個詞來說,就是我們希望能夠有效地提高人們對于景物邊緣的靈敏度和噪音的同時,這種能夠有效地抑制其他人們產生噪音的方式才是良好的邊緣提取技術。值得我們十分慶幸的一點其實是,且個二階線性映射算子仍然能夠在有效抵抗圖形噪聲和對圖形邊緣的線性檢測之間獲得最佳結果折中,這個二階線性映射算子本身其實就是高斯函數的一個二階取值引用導出函數。高斯函數和用于原圖的卷積已經初步達到了一種可以抵抗局部噪聲的主要效果,而用于求導的函數,則被普遍認為已經是我們檢測一個景物局部邊緣的一種重要手段。
設二維高斯函數為
其中,σ為高斯函數的平滑度和分布式的參數,可以被廣泛地基于用來衡量控制網絡對象或者網絡圖像平滑的重要程度。
其中,σ是高斯函數的分布參數,可用以控制對圖像的平滑程度。
最優階躍邊緣檢測算子是以卷積▽G*為基礎的,邊緣強度為
而邊緣方向為
由高斯函數的定義我們得以可知,該高斯函數都可以是無限地從頭拖尾的,在實踐中,一般的各種情況下都方法是將原來的有限模板尺寸截斷為n,至于就達到了有限的模板尺寸。這個新的實驗結果證明,當時,能夠直接取得較好的邊緣化學檢查實驗結果。
5.5.2 Canny算子的實現
下面是Canny算子的具體實現。
利用高斯函數的雙向可分性,將映射▽g的兩個一維濾波卷積上的模板可以分解成兩個一維的濾波行列式式濾波器:
1
2
3
4
5
6
K為常數將式12分別與圖像
則反應出一個在圖像上點處的邊緣強度,是一個在圖像點處的法向力矢量(下一個交于其邊緣線方向)。
根據關于canny的卷積定義,中心邊緣點梯度作為一個卷積算子和它的圖像(x,y)的卷積梯度是在中心邊緣點和梯度相同直線方向的同一區域內兩個算子梯度中的最高值。這樣,就可以能夠通過在各個梯度點的最大梯度值和方位上進行判斷并得出每個該梯度點的最大強度方位是否為其應用領域最大強度值,從而快速確定各個梯度點的邊緣點。例如,當一個矩形像素圖象滿足以下三個基本條件時,則被我們視作該點是一個像素圖像的邊界點。
(1)當像素該中一點的平均邊緣運動強度方向超過了沿著像素該中一點的邊緣梯度方向運動的同方向兩個像素相鄰點的像素中一點的平均邊緣運動強度時;
(2)與該點梯度方向上相鄰兩點的方向差小于45度;
(3)觀測領域核心中的最大邊緣變化強度最大邊緣閾度數值以所在該觀測點位置為領域中心。
此外,如果(1)和(2)同時被邊緣的頂點像素滿足,那么候選選擇梯度最小值相同方向上的兩個非相鄰頂點像素就從候選選擇邊緣的頂點中被直接取消,條件(3)閾值相當于由候選邊緣區域選擇梯度最大的閾值所在點組成的一個閾值,即圖像與候選邊緣的頂點之間的平均距離可以進行閾值匹配,這一消除過程就等于消除了許多虛假的邊緣點。
圖像邊緣檢測的基本步驟:
(1)對于濾波,邊緣的檢測主要是基于引導值進行計算,但是容易受到噪聲影響。然而,該濾波器在減少噪聲時還會造成邊緣強度的損耗。
(2)進行了增強,加強算法把鄰域的點的度有明顯改變的地方突出表現。一般是靠計算梯度的幅值來實現。
(3)進行檢測,但是在有些影像中梯度幅值較大的點并非邊緣端。最簡單的對邊緣性檢測就是梯度幅值閾值的判斷。
(4)定位,精確確定邊緣的位置。
綜上所述,Canny算子的具體算法步驟如下:
(1)使用高斯濾波器對圖像中的信號進行濾波,去除圖像中的干擾和噪聲;
(2)分析利用高斯算子的一階方向偏移濾波函數采用微分的方法對物體圖像中各點方向進行濾波,得到每一點的方向梯度和角強度和物體運動時的方向;
(3)針對梯度方向運動進行“非極大抑制”時對其梯度的反向運動及其方向如圖可以正確定義為其如下如圖所示
x | ||
標識分別為1,2,3,4的四個區域將其屬于四個局部分區之一,各個局部分區用不同的線將相鄰四個像素分別排列來對其局部進行高度比較,以此來決定其每個局部的極大像素值。例如,如果我們在相鄰中心像素圖像獲得x的梯度方向上認為屬于第4區,則把獲得x的極大梯度方向值與其左上和右下兩個方向相鄰中心像素的極大梯度的數值大小進行向量比較,看獲得x的極大梯度的數值大小是否可視為極大梯度值。如果不是,就把每個矩形像素y到x的顏色灰度系數設置為0。這一抑制過程被人們稱之為“非極大抑制”。
(4)對一個梯度進行兩次閾值,即取一個閾值,兩者之間的關系公式為。我們將梯度值小于的每個像素灰度設置為0。然后將梯度值小于的每個像素灰度平均值設定為0。去除了大部分的噪聲,但同時也導致損失了有用的邊緣和界面結構信息。
5.6基于輪廓的描述方法
基于局部輪廓圖對形狀進行描述的設計方法又大致可以細分為局部連續型(注意即局部全局式)和局部離散型(即局部結構式)兩種。連續型全局輪廓圖圖描述的方法并沒有對稱為全局圖的輪廓圖進行任何分段式的處理,往往目的是從整個稱為全局圖的輪廓圖中抽取并給出一個特征向量。這種屬于離散式的分析方法通常首先把它的輪廓特點分解成許多不同片段,然后用傳統計算機輪廓提取法找出其片段相應的輪廓特點。簡單的物體形狀類型描述表示符主要類型包括鏈碼、傅立葉描述符、曲率尺度空間形狀描述表示符和小波描述表示符四種基于物體輪廓的形狀描述表示方式。
5.7傅立葉形狀描述符
傅立葉形狀輪廓描述符即它是一種被廣泛應用的二維模型形狀輪廓描述符,其最基本的設計思想就是用一個直接位于模型物體內部輪廓上沒有邊界的傅立葉變換函數來對其內部形狀輪廓進行精確描述,假設一個二維模型物體的內部輪廓形狀是由一系列每個坐標值函數為的物體像素所組合構造的并組成,其中,n函數為在物體輪廓上每個坐標像素的實際參考映射次數。從這些邊界點的整體坐標中我們常常可以由此推導出來得出四類不同形狀的坐標表達,分別為正弦曲率坐標函數、質心坐標距離、復弦長坐標矢量函數及其余弦長坐標函數。輪廓弧曲線上一個特征點的移動曲率被精確定義是因為該點在輪廓線上切向的移動角度與曲率相當于輪廓弧長之間的角度變動率。曲率密度函數我們通常可以簡單地將其表示形式如下:
其中是輪廓線的切向角度,定義為:
質心點的距離函數可以直接定義成其為從一個物體的邊界點到另一個給定物體的邊界中心之間距離,如下所示:
復坐標函數是用復數表示的像素坐標:
這種復雜的坐標向量函數的傅立葉變換形式可以用來產生一系列關于復數的坐標系數。這些頻率系數從微觀頻率上直接反映表示了各個類型物體的宏觀形狀,其中較低和高頻度的物體分量值就代表了各個類型物體微觀形狀的具體性和宏觀細節屬性,高頻度的物體分量值則代表了各個類型物體宏觀形狀的具體微觀細節屬性特點。形狀圖的描述符參數可以通過這些圖形轉換器的參數計算得出。為了使其能夠更好保持與參數旋轉的速度無關性,我們簡單地僅僅保留了每個參數的旋轉尺寸位置信息,而且同時省略了參數相位位置信息。縮放參數無關性通常由于在保證把縮放參數值的大小同時減少添加到c和dc中的分量(或第一個不為零的縮放參數)之后縮放才能得到確認。請特別注意圖形轉換中的無關性就是基于物體輪廓上的形狀屬性來轉換表示固有的轉換屬性。對于具有曲率向量函數和質心之間距離的曲率函數,我們只不過需要分別考慮正交角頻率的兩個坐標時間軸,因為這時兩個函數的傅立葉變換都必須是對稱的,即有。基于點的曲率三角函數的一種形狀線性描述符號也可以使其表示形式為:
其中整數代表傅立葉變換每個參數的第一至i個整數分量。類似的,由質心粒子間距所做的推測計算得到的粒子形態可以描述
符為:
對于一個復雜的坐標密度函數,正值的頻率密度分量和負值的頻率密度分量被同時廣泛使用。由于函數dc的地理參數定義是否與某些形態條件所在處或地點的地理位置密切相關而因此得以常被忽略。因此,第一個不是零的微波頻率參數分量被廣泛應用于后來用于標準化其它的微波變換頻率參數。復函數坐標系是函數所有的推導形式得到的坐標形態為其描述符式為其定義方程為:
為了能夠保證在整個特征數據庫中所有位于物體的各種特征形狀和其他特征均可以具有相同的特征直徑和特征長度,在第一開始進行實施傅立葉變換前后你需要把所有位于物體邊界點的個別特征數目可以統一添加到m。因此算法可以被直接替換為傅立葉變換法的方式使用來大大幅度改善這個算法的執行效率。
5.8圖像的相似性度量
在基于特征信息的圖像內容檢索圖像信息檢索中,特征的信息相似性和特征度量也被廣泛認為已經是一個亟待解決的重大檢索技術研究課題之一。只有在根據分析結果得到特點圖像的兩個特點后后再進行對該兩個特點的圖像相似性距離進行準確度量,才能有效的根據圖像相似性和圖像距離情況做出準確判斷,實現對該特點圖像的準確檢索。為了更好地準確達到不同特征數據檢索的提取目標,需要針對特征提取后得出的不同特征數據進行相似度的分析計算。相似性系數是以一個特殊數值的表示方式被用來顯示表達兩個不同物體之間的事物相似性相關程度的一種數學度量式的結果。將一個人類圖像的各種特征檢索觀察點可看作等同是圖像位于一個坐標標準空間的一個特征點,兩個圖像特征觀察點的相似度和特征距離即相似度通常用它們之間的特征距離系數來精確表示,不同特征種類的圖像特征檢索數據所指的需要同時采用的相似度及其度量計算函數都可能是不一樣的,相似性和度度量函公式的正確選擇的恰當與否往往會對特征檢索結果精確度與否產生很大的直接影響,合適點的距離才是度量計算函數的正確選擇,將來也會幫助使得人類圖像的各個特征向量比較更加容易契合了解的人類對于各種視覺圖像感知技術方面圖像內容的特征仿真,有助于基于人類視覺圖像感知技術方面的人類圖像特征檢索分析技術的仿真性能和實際應用。
假設我們在一個圖像的數據庫中,用兩個特征向量分別來描述和表示任意一個圖像的特征,其中 x 和 y ,分別為是任意兩個圖像的特征向量,它們之間的接近程度我們可以通過采用距離的度量或者是統計學的方法等等來對這兩個圖像的相似性做出判斷。常見的距離測度度量主要有歐幾里德、Manhattan等。下面就我重點介紹一下歐幾里德的距離。
歐幾里德的線性距離函數是一種在實際上已經使用十分廣泛的線性距離函數變量。它的變量計算簡單,并且同時也和國際參考動力系統理論中的徑向旋轉不確定變量計算有密切相互聯系。它的英文含義:
例如當我們發生了數據的丟失或者是當所有的特征矢量都不具備相同的權重時,那么就無法利用歐幾里德距離計算方法來對其進行類似性的測度。為了避免這類情況,在實踐和研究的過程中,我們可以針對歐幾里德的距離進行歸一化。歸一化歐幾里德距離的定義公式如下圖所示:
6、實驗結果分析
圖像庫中包括簡單幾何形狀,其中星形、心形、圓形、新月形圖像10幅。從分析我們不僅可以清楚地明顯看出,算法對于檢索圖像的視覺扭轉和圖像形變都真的是十分具有非常強的不變性,并對于檢索圖像的基本主觀形態和視覺特性也是非常具有魯棒性,在就算沒有一定的圖像形變和扭轉干擾等等條件的特殊情況下,仍然完全可以直接得出良好的視覺圖像判斷檢索實驗結果;且由于算法檢索圖像結果所需要排列的持續時間和排列順序與檢索個體的視覺主觀性和視覺特征判斷檢索方式大致相同,檢索結果準確率也比較高。
六、以形狀為特點的圖像檢索系統設計
6.1檢索基本思想
本文文件檢索的基本工作方法主要內容是:在根據設計需要建立矩形圖像庫時,對不同輸入的兩個矩形圖像子存入進行綜合分析,分別選擇采用經過改進后的不同可變矩和二維極坐標傅里葉描述子對兩個圖像的不同形狀和狀態特征向量進行綜合描述;在將兩個圖像子的存入轉換到二維矩形圖像庫同時,也將其中兩個相應的不同可變矩和二維極坐標傅里葉描述子的形狀特征向量分別存入二維矩形圖像庫的特征庫.檢索時,根據所有用戶需要提供的圖像查詢數據示例檢索圖像,采用通過線性函數加權方法求和的一種計算結果方式,計算其與二維矩形圖像庫中各不同類型矩形圖像的各種綜合相似度,把計算結果對子集中的一個大于一定相似度的圖像結果集進行返回發送給所有用戶.6.2 Canny算子的程序設計
本文是用C++編程來實現圖像的處理,整體流程圖如圖所示
未打開
N
Y
Canny算子程序流程圖如圖所示:
6.2.1圖像特征數據庫設計
基于圖像形狀和特征的檢索系統中的一個圖像特征數據庫是用來存放和分析圖像倉庫中不同圖像之間的形狀和特點。在這里,將計算得到的一組圖像的形狀和特征(曲率、質心距離、復坐標和弦長)從 Access中存放到一個相應的特征列表中,組成了一個特征數據庫。
對于圖像的檢索,本文特別設計了對圖像入庫、顯示、刪除和添加描述四個功能。首先,利用灰度共生矩陣提取的方法得到一個圖像的形狀特征,并將這些特征數據存儲在 access 數據庫中;然后,利用基于文本或者簡單的縮略圖瀏覽等多種方式從 access 數據庫中尋找到一個示例的圖像,同時,針對該一個示例圖像進行基于其形狀和特征的內容檢索和匹配,并根據需要給出檢索結果的圖像。
6.3實驗結果
以下是原圖與處理后的圖片,其中圖3-4為原始圖片,圖3-5為Canny 算子處理后的圖片。
從上述處理過的數據和圖像中我們可以清楚地看出, canny 算子所處理的數據和圖像不但達到了準確地提取邊緣信息的主要目的,提高了抵御干擾的能力外,還使得邊緣更為連續清晰。
七、基于圖像形狀學特點的檢索方法在系統中的實現
7.1系統框架
一般的圖像檢索子系統主要有兩個大部分共同組成:圖像產生子系統和數據庫檢索子系統,如圖4-1所示。圖像產生的子系統主要是對于圖像輸入前進行的預處理、圖像中內容的特性提取以及把這些特性和部件描述的信息納入到數據庫中。圖像檢索子系統主要是完成對圖像的檢索,其中包含了瀏覽和查詢、圖像特點的相似性匹配以及圖形使用者接口等幾個部分。
在本文的兩個實驗物理子系統中,圖像特征制作與截圖生成實驗子系統將本文中所需要描述的流體物理學圖像特征及其應用對象的局部輪廓特征進行了綜合分析并并入庫。在這個圖像輪廓檢索工具子系統中,支持一個用戶通過瀏覽庫中現有的一個圖像庫,手動地繪制一個圖像庫的輪廓及然后選擇一個示例的視圖。
7.2編程環境
本次測試實驗操作系統的主要程序開發工具平臺主要是Window XP,選擇使用Visual C++6.0和Access兩款軟件作為主要的程序開發工具,選擇Visual C++6.0和Access是因為它們都能夠具有面向對象應用程序設計的基本整體化和性能設計特點以及所需要開發的所有應用程序都能夠具有高度的效率地正常運行。同時又是一種微軟技術性高度相互集成的企業軟件開發實用工具,它為企業用戶自己提供了一套功能強大的企業微軟軟件基礎類庫。且因我們已經使用了Visual C++6.0來用于開發一個基于視頻內容的數字視頻流和圖像信息檢索系統。由于芯片系統內部采用了面向對象的圖像設計工作方式,這樣也就使得芯片系統的許多圖像功能以及處理圖像模塊都完全可以直接整合應用起來到其它的芯片圖像處理系統中,而且需要添加新的圖像算法也就不必再因為需要額外復雜地進行修改許多的圖像源代碼,非常好地有助于整個芯片系統在圖像功能上的逐步完善和不斷擴展。
7.3程序結果
首先打開一個圖像庫選擇一個圖像,然后對該圖像進行特征提取。系統通過圖像檢索相似度的匹配,找到六個與其相似的圖像,輸出結果。找到六個與其相似的圖像,輸出結果。
八、總結
本文第一章對基于內容的圖像檢索方式進行了概述,進而又著重介紹了基于形態的圖像檢索方式。并且廣泛地應用了對圖像進行邊緣檢查的技術,對整個圖像進行了檢索。它主要是運用 canny 算子的方法。首先,是對邊緣的檢測主要以導數來計算,但是受到了噪聲影響。然而,該濾波器在減少了噪聲的作用下,也造成了邊緣強度的損耗。其次,增強算法把對鄰域的點的度有明顯改變的地方以及點凸顯性地展現了。一般可以靠計算機梯度的幅值來實現。再次,但是在有些圖象中,梯度幅值比較大的地方并非邊緣的節點。最簡單的對邊緣性檢測就是梯度幅值閾值的判斷。最后,精確地選擇了邊緣處的位置。
我也希望在今后的將來有更多的人去探導、研究一個邊緣檢測算子,為使我們能夠看到更好的影片效果而努力,為了促進全人類的生活和發展而努力。圖像是自古以來人類識別和交流信息的一個主要資料來源,因此,圖像處理的應用領域已經涵蓋到了人類日常生活、工作等諸多領域。隨著現代科學技術的發展和進步,圖像的應用領域也在不斷拓寬。所以對于邊緣性的檢測也是需要繼續進步。我看到將來,邊緣檢測技術已經廣泛地應用于人們日常生活的各個領域,在當今世界人類的日常生活中,文化藝術、軍事技術、生物醫療技術、工業生產和信息工程技術、航天與空間技術等等重要的領域都占有著不可或缺的一部分。同全人類的生活走向風流。
參考文獻
[1] 章毓晉.圖像處理和分析[M].北京:清華大學出版社,1999
[2] 章國寶.葉樺.陳維南.基于正交小波變換的多尺度邊緣提取[J].中國圖像圖形報,1998(3)
[3] 陳武凡..彩色圖像邊緣檢測新算法?廣義模糊算子法[J].中國科學A輯,1995(2)
[4] 唐立軍.段立娟.高文.基于內容的圖像檢索系統[J].計算機應用研究,2001,18(7):41-45
[5] 馮所前.文檔內容圖像檢索[D].北京大學信息科學技術學院智能科學系碩士學位論文,2005
[6] 謝毓湘.吳玲達.欒悉道.基于內容的圖像檢索技術研究[J].計算機工程與應用,2002(1):35-38
[7] 宋濤.劉剛.一種基于內容的文檔圖像檢索方法.《鄭州大學報》,2010年1月
[8] 郭小娟.基于內容的圖像檢索技術的研究[D].西安:西北大學,2007
[9] 徐建華.圖像處理與分析[M ].北京:科學出版社,1992
[10] 賈元元.基于形狀的圖像數據庫檢索技術研究[學位論文] 2004
[11] Ang Y H.Image Retrieval Based on Multidimensional Feature Properties 1995
[12] 賴志國.余嘯海.Matlab 圖像處理與應用[M].北京:國防工業出版社,2004
[13] 唐路路.張啟燦.一種自適應閾值的Canny邊緣檢測算法/光電工程:第38卷第5期,2011.5