第一篇:常用圖片后綴格式識別常識
一、BMP格式
BMP是英文Bitmap(位圖)的簡寫,它是Windows操作系統中的標準圖像文件格式,能夠被多種Windows應用程序所支持。隨著Windows操作系統的流行與豐富的Windows應用程序的開發,BMP位圖格式理所當然地被廣泛應用。這種格式的特點是包含的圖像信息較豐富,幾乎不進行壓縮,但由此導致了它與生俱生來的缺點--占用磁盤空間過大。所以,目前BMP在單機上比較流行。
二、GIF格式
GIF是英文Graphics Interchange Format(圖形交換格式)的縮寫。顧名思義,這種格式是用來交換圖片的。事實上也是如此,上世紀80年代,美國一家著名的在線信息服務機構CompuServe針對當時網絡傳輸帶寬的限制,開發出了這種GIF圖像格式。
GIF格式的特點是壓縮比高,磁盤空間占用較少,所以這種圖像格式迅速得到了廣泛的應用。最初的GIF只是簡單地用來存儲單幅靜止圖像(稱為GIF87a),后來隨著技術發展,可以同時存儲若干幅靜止圖象進而形成連續的動畫,使之成為當時支持2D動畫為數不多的格式之一(稱為GIF89a),而在GIF89a圖像中可指定透明區域,使圖像具有非同一般的顯示效果,這更使GIF風光十足。目前Internet上大量采用的彩色動畫文件多為這種格式的文件,也稱為GIF89a格式文件。
此外,考慮到網絡傳輸中的實際情況,GIF圖像格式還增加了漸顯方式,也就是說,在圖像傳輸過程中,用戶可以先看到圖像的大致輪廓,然后隨著傳輸過程的繼續而逐步看清圖像中的細節部分,從而適應了用戶的“從朦朧到清楚”的觀賞心理。目前Internet上大量采用的彩色動畫文件多為這種格式的文件。
但GIF有個小小的缺點,即不能存儲超過256色的圖像。盡管如此,這種格式仍在網絡上大行其道應用,這和GIF圖像文件短小、下載速度快、可用許多具有同樣大小的圖像文件組成動畫等優勢是分不開的。
三、JPEG格式
JPEG也是常見的一種圖像格式,它由聯合照片專家組(Joint Photographic Experts Group)開發并以命名為“ISO 10918-1”,JPEG僅僅是一種俗稱而已。JPEG文件的擴展名為.jpg或.jpeg,其壓縮技術十分先進,它用有損壓縮方式去除冗余的圖像和彩色數據,獲取得極高的壓縮率的同時能展現十分豐富生動的圖像,換句話說,就是可以用最少的磁盤空間得到較好的圖像質量。
同時JPEG還是一種很靈活的格式,具有調節圖像質量的功能,允許你用不同的壓縮比例對這種文件壓縮,比如我們最高可以把1.37MB的BMP位圖文件壓縮至20.3KB。當然我們完全可以在圖像質量和文件尺寸之間找到平衡點。
由于JPEG優異的品質和杰出的表現,它的應用也非常廣泛,特別是在網絡和光盤讀物上,肯定都能找到它的影子。目前各類瀏覽器均支持JPEG這種圖像格式,因為JPEG格式的文件尺寸較小,下載速度快,使得Web頁有可能以較短的下載時間提供大量美觀的圖像,JPEG同時也就順理成章地成為網絡上最受歡迎的圖像格式。
四、JPEG2000格式
JPEG 2000同樣是由JPEG 組織負責制定的,它有一個正式名稱叫做“ISO 15444”,與JPEG相比,它具備更高壓縮率以及更多新功能的新一代靜態影像壓縮技術。
JPEG2000 作為JPEG的升級版,其壓縮率比JPEG高約30%左右。與JPEG不同的是,JPEG2000 同時支持有損和無損壓縮,而 JPEG 只能支持有損壓縮。無損壓縮對保存一些重要圖片是十分有用的。JPEG2000的一個極其重要的特征在于它能實現漸進傳輸,這一點與GIF的“漸顯”有異曲同工之妙,即先傳輸圖像的輪廓,然后逐步傳輸數據,不斷提高圖像質量,讓圖象由朦朧到清晰顯示,而不必是像現在的 JPEG 一樣,由上到下慢慢顯示。
此外,JPEG2000還支持所謂的“感興趣區域”特性,你可以任意指定影像上你感興趣區域的壓縮質量,還可以選擇指定的部份先解壓縮。JPEG 2000 和 JPEG 相比優勢明顯,且向下兼容,因此取代傳統的JPEG格式指日可待。
JPEG2000可應用于傳統的JPEG市場,如掃描儀、數碼相機等,亦可應用于新興領域,如網路傳輸、無線通訊等等。
五、TIFF格式
TIFF(Tag Image File Format)是Mac中廣泛使用的圖像格式,它由Aldus和微軟聯合開發,最初是出于跨平臺存儲掃描圖像的需要而設計的。它的特點是圖像格式復雜、存貯信息多。正因為它存儲的圖像細微層次的信息非常多,圖像的質量也得以提高,故而非常有利于原稿的復制。
該格式有壓縮和非壓縮二種形式,其中壓縮可采用LZW無損壓縮方案存儲。不過,由于TIFF格式結構較為復雜,兼容性較差,因此有時你的軟件可能不能正確識別TIFF文件(現在絕大部分軟件都已解決了這個問題)。目前在Mac和PC機上移植TIFF文件也十分便捷,因而TIFF現在也是微機上使用最廣泛的圖像文件格式之一。
六、PSD格式
這是著名的Adobe公司的圖像處理軟件Photoshop的專用格式Photoshop Document(PSD)。PSD其實是Photoshop進行平面設計的一張“草稿圖”,它里面包含有各種圖層、通道、遮罩等多種設計的樣稿,以便于下次打開文件時可以修改上一次的設計。在Photoshop所支持的各種圖像格式中,PSD的存取速度比其它格式快很多,功能也很強大。由于Photoshop越來越被廣泛地應用,所以我們有理由相信,這種格式也會逐步流行起來。
七、PNG格式
PNG(Portable Network Graphics)是一種新興的網絡圖像格式。在1994年底,由于Unysis公司宣布GIF擁有專利的壓縮方法,要求開發GIF軟件的作者須繳交一定費用,由此促使免費的png圖像格式的誕生。PNG一開始便結合GIF及JPG兩家之長,打算一舉取代這兩種格式。1996年10月1日由PNG向國際網絡聯盟提出并得到推薦認可標準,并且大部分繪圖軟件和瀏覽器開始支持PNG圖像瀏覽,從此PNG圖像格式生機煥發。
PNG是目前保證最不失真的格式,它汲取了GIF和JPG二者的優點,存貯形式豐富,兼有GIF和JPG的色彩模式;它的另一個特點能把圖像文件壓縮到極限以利于網絡傳輸,但又能保留所有與圖像品質有關的信息,因為PNG是采用無損壓縮方式來減少文件的大小,這一點與犧牲圖像品質以換取高壓縮率的JPG有所不同;它的第三個特點是顯示速度很快,只需下載1/64的圖像信息就可以顯示出低分辨率的預覽圖像;第四,PNG同樣支持透明圖像的制作,透明圖像在制作網頁圖像的時候很有用,我們可以把圖象背景設為透明,用網頁本身的顏色信息來代替設為透明的色彩,這樣可讓圖像和網頁背景很和諧地融合在一起。
PNG的缺點是不支持動畫應用效果,如果在這方面能有所加強,簡直就可以完全替代GIF和JPEG了。Macromedia公司的Fireworks軟件的默認格式就是PNG。現在,越來越多的軟件開始支持這一格式,而且在網絡上也越來截止流行。
八、SWF格式
利用Flash我們可以制作出一種后綴名為SWF(Shockwave Format)的動畫,這種格式的動畫圖像能夠用比較小的體積來表現豐富的多媒體形式。在圖像的傳輸方面,不必等到文件全部下載才能觀看,而是可以邊下載邊看,因此特別適合網絡傳輸,特別是在傳輸速率不佳的情況下,也能取得較好的效果。事實也證明了這一點,SWF如今已被大量應用于WEB網頁進行多媒體演示與交互性設計。此外,SWF動畫是其于矢量技術制作的,因此不管將畫面放大多少倍,畫面不會因此而有任何損害。綜上,SWF格式作品以其高清晰度的畫質和小巧的體積,受到了越來越多網頁設計者的青睞,也越來越成為網頁動畫和網頁圖片設計制作的主流,目前已成為網上動畫的事實標準。
九、SVG格式
SVG可以算是目前最最火熱的圖像文件格式了,它的英文全稱為Scalable Vector Graphics,意思為可縮放的矢量圖形。它是基于XML(Extensible Markup Language),由World Wide Web Consortium(W3C)聯盟進行開發的。嚴格來說應該是一種開放標準的矢量圖形語言,可讓你設計激動人心的、高分辨率的Web圖形頁面。用戶可以直接用代碼來描繪圖像,可以用任何文字處理工具打開SVG圖像,通過改變部分代碼來使圖像具有互交功能,并可以隨時插入到HTML中通過瀏覽器來觀看。
它提供了目前網絡流行格式GIF和JPEG無法具備了優勢:可以任意放大圖形顯示,但絕不會以犧牲圖像質量為代價;字在SVG圖像中保留可編輯和可搜尋的狀態;平均來講,SVG文件比JPEG和GIF格式的文件要小很多,因而下載也很快。可以相信,SVG的開發將會為Web提供新的圖像標準。
十、CDR
著名的圖形設計軟件——CorelDRAW的專用格式,屬于矢量圖像,最大的優點“體重”很輕,便于再處理。
總的來說,有兩種截然不同的圖像格式類型: 即有損壓縮和無損壓縮。
1.有損壓縮
有損壓縮可以減少圖像在內存和磁盤中占用的空間,在屏幕上觀看圖像時,不會發現它對圖像的外觀產生太大的不利影響。因為人的眼睛對光線比較敏感,光線對景物的作用比顏色的作用更為重要,這就是有損壓縮技術的基本依據。
有損壓縮的特點是保持顏色的逐漸變化,刪除圖像中顏色的突然變化。生物學中的大量實驗證明,人類大腦會利用與附近最接近的顏色來填補所丟失的顏色。例如,對于藍色天空背景上的一朵白云,有損壓縮的方法就是刪除圖像中景物邊緣的某些顏色部分。當在·屏幕上看這幅圖時,大腦會利用在景物上看到的顏色填補所丟失的顏色部分。利用有損壓縮技術,某些數據被有意地刪除了,而被取消的數據也不再恢復。
無可否認,利用有損壓縮技術可以大大地壓縮文件的數據,但是會影響圖像質量。如果使用了有損壓縮的圖像僅在屏幕上顯示,可能對圖像質量影響不太大,至少對于人類眼睛的識別程度來說區別不大。可是,如果要把一幅經過有損壓縮技術處理的圖像用高分辨率打印機打印出來,那么圖像質量就會有明顯的受損痕跡。2.無損壓縮
無損壓縮的基本原理是相同的顏色信息只需保存一次。壓縮圖像的軟件首先會確定圖像中哪些區域是相同的,哪些是不同的。包括了重復數據的圖像(如藍天)就可以被壓縮,只有藍天的起始點和終結點需要被記錄下來。但是藍色可能還會有不同的深淺,天空有時也可能被樹木、山峰或其他的對象掩蓋,這些就需要另外記錄。從本質上看,無損壓縮的方法可以刪除一些重復數據,大大減少要在磁盤上保存的圖像尺寸。但是,無損壓縮的方法并不能減少圖像的內存占用量,這是因為,當從磁盤上讀取圖像時,軟件又會把丟失的像素用適當的顏色信息填充進來。如果要減少圖像占用內存的容量,就必須使用有損壓縮方法。
無損壓縮方法的優點是能夠比較好地保存圖像的質量,但是相對來說這種方法的壓縮率比較低。但是,如果需要把圖像用高分辨率的打印機打印出來,最好還是使用無損壓縮幾乎所有的圖像文件都采用各自簡化的格式名作為文件擴展名。從擴展名就可知道這幅圖像是按什么格式存儲的,應該用什么樣的軟件去讀/寫等等。
其它非主流圖像格式:
1、PCX格式
PCX格式是ZSOFT公司在開發圖像處理軟件Paintbrush時開發的一種格式,這是一種經過壓縮的格式,占用磁盤空間較少。由于該格式出現的時間較長,并且具有壓縮及全彩色的能力,所以現在仍比較流行。PCX這種圖像文件的形成是有一個發展過程的。最先的PCX雛形是出現在ZSOFT公司推出的名叫PC PAINBRUSH的用于繪畫的商業軟件包中。以后,微軟公司將其移植到 Windows環境中,成為Windows系統中一個子功能。先在微軟的Windows3.1中廣泛應用,隨著Windows的流行、升級,加之其強大的圖像處理能力,使PCX同GIF、TIFF、BMP圖像文件格式一起,被越來越多的圖形圖像軟件工具所支持,也越來越得到人們的重視。
PCX是最早支持彩色圖像的一種文件格式,現在最高可以支持256種彩色,如圖4-25所示,顯示256色的彩色圖像。PCX設計者很有眼光地超前引入了彩色圖像文件格式,使之成為現在非常流行的圖像文件格式。
PCX圖像文件由文件頭和實際圖像數據構成。文件頭由128字節組成,描述版本信息和圖像顯示設備的橫向、縱向分辨率,以及調色板等信息:在實際圖像數據中,表示圖像數據類型和彩色類型。PCX圖像文件中的數據都是用PCXREL技術壓縮后的圖像數據。
PCX是PC機畫筆的圖像文件格式。PCX的圖像深度可選為l、4、8bit。由于這種文件格式出現較早,它不支持真彩色。PCX文件采用RLE行程編碼,文件體中存放的是壓縮后的圖像數據。因此,將采集到的圖像數據寫成PCX文件格式時,要對其進行RLE編碼:而讀取一個PCX文件時首先要對其進行 RLE解碼,才能進一步顯示和處理。
2、DXF格式
DXF(Autodesk Drawing Exchange Format)是AutoCAD中的矢量文件格式,它以ASCII碼方式存儲文件,具有文件小,所繪圖形尺寸、角度等數據十分精確的特點,許多軟件都支持DXF格式的輸入與輸出,是建筑設計的首選。
3、WMF格式
WMF(Windows Metafile Format)是Windows中常見的一種圖元文件格式,屬于矢量文件格式。它具有文件短小、圖案造型化的特點,整個圖形常由各個獨立的組成部分拼接而成,其圖形往往較粗糙。
4、EMF格式
EMF(Enhanced Metafile)是微軟公司為了彌補使用WMF的不足而開發的一種Windows 32位擴展圖元文件格式,也屬于矢量文件格式,其目的是欲使圖元文件更加容易接受
5、LIC(FLI/FLC)格式
Flic格式由Autodesk公司研制而成,FLIC是FLC和FLI的統稱:FLI是最初的基于320×200分辨率的動畫文件格式,而FLC則采用了更高效的數據壓縮技術,所以具有比FLI更高的壓縮比,其分辨率也有了不少提高。
6、EPS格式
EPS(Encapsulated PostScript)是PC機用戶較少見的一種格式,而蘋果Mac機的用戶則用得較多。它是用PostScript語言描述的一種ASCII碼文件格式,主要用于排版、打印等輸出工作。
7、TGA格式
TGA(Tagged Graphics)文件是由美國Truevision公司為其顯示卡開發的一種圖像文件格式,已被國際上的圖形、圖像工業所接受。TGA的結構比較簡單,屬于一種圖形、圖像數據的通用格式,在多媒體領域有著很大影響,是計算機生成圖像向電視轉換的一種首選格式。
第二篇:食品簡單識別常識
食品簡單的識別常識
一、食品感官常識
所謂食品質量感官鑒別的基本方法,其實質就是依靠視覺、嗅覺、味覺、觸覺和聽覺等來鑒定食品的外觀形態、色澤、氣味、滋味和硬度(稠度)。其主要還是通過四覺來鑒定,下面就具體談談這四覺。
1、視覺鑒別法。這是判斷食品質量的一個重要感官手段。食品的外觀形態和色澤對于評價食品的新鮮程度、食品是否有不良改變以及蔬菜、水果的成熟度等有著重要意義。視覺鑒別應在白晝的散射光線下進行,以免燈光隱色發生錯覺。鑒別時應注意整體外觀、大小、形態、塊形的完整程度、清潔程度,表面有無光澤、顏色的深淺色調等。在鑒別液態食品時,要將它注人無色的玻璃器皿中,透過光線來觀察;也可將瓶子顛倒過來,觀察其中有無夾雜物下沉或絮狀物懸浮。
2、嗅覺鑒別法。人的嗅覺器官相當敏感,甚至用儀器分析的方法也不一定能檢查出來極輕微的變化,用嗅覺鑒別卻能夠發現。當食品發生輕微的腐敗變質時,就會有不同的異味產生。如核桃的核仁變質所產生的酸敗而有哈喇味,西瓜變質會帶有餿昧等。食品的氣味是一些具有揮發性的物質形成的,所以在進行嗅覺鑒別時常需稍稍加熱,但最好是在15℃~25℃的常溫下進行,因為食品中的氣味揮發性物質常隨溫度的高低而增減。在鑒別食品的異味時,液態食品可滴在清潔的手掌上摩擦,以增加氣味的揮發;識別畜肉等大塊食品時,可將一把尖刀稍微加熱刺入深部,拔出后立即嗅聞氣味。食品氣味鑒別的順序應當是先識別氣味淡的,后鑒別氣味濃的,以免影響嗅覺的靈敏度。在鑒別前禁止吸煙。
3、味覺鑒別法。感官鑒別中的味覺對于辨別食品品質的優劣是非常重要的一環。味覺器官不但能品嘗到食品的滋味如何,而且對于食品中極輕微的變化也能敏感地察覺。如做好的米飯存放到尚未變餿時,其味道即有相應的改變。味覺器官的敏感性與食品的溫度有關,在進行食品的滋味鑒別時,最好使食品處在20℃~45℃之間,以免溫度的變化會增強或減低對味覺器官的刺激。幾種不同味道的食品在進行感官評價時,應當按照刺激性由弱到強的順序,最后鑒別味道強烈的食品。在進行大量樣品鑒別時,中間必須休息,每鑒別一種食品之后必須用溫水漱口
4、觸覺鑒別法。憑借觸覺來鑒別食品的膨、松、軟、硬、彈性(稠度),以評價食品品質的優劣,也是常用的感官鑒別方法之一。例如,根據魚體肌肉的硬度和彈性,常常可以判斷魚是否新鮮或腐敗;評價動物油脂的品質時,常須鑒別其稠度等。在感官測定食品的硬度(稠度)時,要求溫度應在15℃~20℃之間,因為溫度的升降會影響到食品狀態的改變。
必須做到全面,合理、客觀、公正,所以在實施中是有具體原則的。其基本原則有六點:
1、《中華人民共和國產品質量法》、《中華人民共和國食品安全法》、國務院有關部委和省、市行政部門頒布的食品質量法規和衛生法規是鑒別各類食品能否食用的主要依據。(2)食品已明顯腐敗變質或含有過量的有
毒有害物質(如重金屬含量過高或霉變)時,不得供食用。達不到該種食品的營養和風味要求,顯系假冒偽劣食品的,不得供食用。
3、食品由于某種原因不能直接食用,必須加工復制或在其他條件下處理的,可提出限定加工條件和限定食用及銷售等方面的具體要求。
4、食品某些指標的綜合評價結果略低于衛生標準,而新鮮度、病原體、有毒有害物質含量均符合衛生時,可提出要求在某種條件下供人食用。
5、在鑒別指標的掌握上,嬰幼兒、病人食用的食品要嚴于成年人、健康人食用的食品。
6、鑒別結論必須明確,不得含糊不清,對附條件可食的食品,應將條件寫清楚。對于沒有鑒別參考標準的食品,可參照有關同類食品恰當地鑒別。
7、在進行食品質量綜合性鑒別前,應向有關單位或個人收集該食品的有關資料,如食品的來源、保管方法、貯存時間、原料組成、包裝情況以及加工、運輸、貯藏、經營過程中的衛生情況,尋找可疑環節,為上述鑒別結論提供必要的正確判斷基礎。
二、食品標簽常識
食品包裝上,應載有以下信息:
1、產品名稱:國家標準規定的名稱或與食品屬性相關的名稱
2、加工工藝:如:油炸、非油炸、冷加工、熱加工,烘烤、低溫、高溫等
3、凈含量:
4、配料表:如:水、小麥粉、白砂糖、食用植物油、飴糖
5、食用添加劑:如:甜蜜素、碳酸氫銨、碳酸氫鈉
6、執行標準:如:GB/T20977-20077、生產日期:
8、保質期:如:90天
9、貯存方式:如:通風、干燥、清潔處常溫保存(或低溫條件儲存)
10、生產許可證編號:如:QS1304 2401 104911、生產商:與營業執照注冊的名稱相一致
12、廠址:與營業執照注冊的地址相一致
13、產地:河北省邯鄲市(要求標到市級)
14、聯系電話:
15、注意事項:如:運輸過程中應輕拿、輕放、防雨、防曬
16、產品標準要求必須標注的。
邱縣質量技術監督局食品安全舉報電話:12365
第三篇:基于MATLAB的圖片中文字的提取及識別
數字圖象處理
Digital Image Progressing 基于MATLAB的圖片中文字的提取及識別
鄒浩,余龍,鄒勇博,劉宇童,和振喬,李少梅(西安電子科技大學 電子工程學院,西安,710126)
摘要
隨著現代社會的發展,信息的形式和數量正在迅猛增長。其中很大一部分是圖像,圖像可以把事物生動地呈現在我們面前,讓我們更直觀地接受信息。同時,計算機已經作為一種人們普遍使用的工具為人們的生產生活服務。從圖像中提取文字屬于信息智能化處理的前沿課題,是當前人工智能與模式識別領域中的研究熱點。由于文字具有高級語義特征,對圖片內容的理解、索引、檢索具有重要作用,因此,研究圖片文字提取具有重要的實際意義。又由于靜態圖像文字提取是動態圖像文字提取的基礎,故著重介紹了靜態圖像文字提取技術。
關鍵詞:MATLAB 圖像處理 文字提取 文字識別
Text Extraction and Recognition in Images Based on MATLAB
ZOU Hao, YU long, ZOU Yongbo, LIU Yutong, HE Zhenqiao, LI Shaomei(Xidian University Electronic Engineering College,Xi'an,710126)
Abstract
With the development of society,the form and quantity of imformation are increasing quickly.A large part of them are images,which can make things vividly presented in front of us,let us more intuitive to accept information.At the same time, the computer has been as a widely used tool for people's production and living services.Extracting text from image belongs to the frontier of intelligent information processing, and it is the current hot research topic in the field of artificial intelligence and pattern recognition.As the text with high-level semantic feature and plays an important role on understanding,indexing and retrieval image content.Therefore,the study on extracting texts from images have important actual meanings.And because extracting texts from still images is the basis for extracting texts from dynamic images, the article emphatically introduces the technology of extracting texts from still images.Key Words: MATLAB image processing word extraction word recognition 數字圖象處理
Digital Image Progressing
一.引言
隨著計算機科學的飛速發展,以圖像為主的多媒體信息迅速成為重要的信息傳遞媒介,在圖像中,文字信息(如新聞標題等字幕)包含了豐富的高層語義信息,提取出這些文字,對于圖像高層語義的理解、索引和檢索非常有幫助。圖像文字提取又分為動態圖像文字提取和靜態圖像文字提取兩種,其中,靜態圖像文字提取是動態圖像文字提取的基礎,其應用范圍更為廣泛,對它的研究具有基礎性,所以本文主要討論靜態圖像的文字提取技術。靜態圖像中的文字可分成兩大類: 一種是圖像中場景本身包含的文字, 稱為場景文字; 另一種是圖像后期制作中加入的文字, 稱為人工文字,如右圖所示。場景文字由于其出現的位置、小、顏色和形態的隨機性, 一般難于檢測和提取;而人工文字則字體較規范、大小有一定的限度且易辨認,顏色為單色, 相對與前者更易被檢測和提取,又因其對圖像內容起到說明總結的作用,故適合用來做圖像的索引和檢索關鍵字。對圖像中場景文字的研究難度大,目前這方面的研究成果與文獻也不是很豐富,本文主要討論圖像中人工文字提取技術。
二.靜態圖像中文字的特點
靜態圖像中文字(本文特指人工文字,下同)具有以下主要特征:(1)文字位于前端,且不會被遮擋;(2)文字一般是單色的;
(3)文字大小在一幅圖片中固定,并且寬度和高度大體相同,從滿足人眼視覺感受的角度來說,圖像中文字的尺寸既不會過大也不會過小;(4)文字的分布比較集中;
(5)文字的排列一般為水平方向或垂直方向;
(6)多行文字之間,以及單行內各個字之間存在不同于文字區域的空隙。在靜態圖片文字的檢測與提取過程中, 一般情況下都是依據上述特征進行處理的。
三.文字提取、識別的一般流程 數字圖象處理
Digital Image Progressing 靜態圖像文字提取一般分為以下步驟:文字區域檢測與定位、文字分割與文字提取、文字后處理。其流程如圖1所示。
(圖1)
四.文字提取、識別的詳細步驟
1.在Matlab中調用i1=imread('字符.jpg'),可得到原始圖像,如圖2所示:
(圖2)
2.調用i2=rgb2gray(i1),則得到了灰度圖像,如圖3所示:
(圖3)
調用a=size(i1);b=size(i2);可得到:a=3,b=2 即三維圖像變成了二維灰度圖像
3.調用i3=(i2>=thresh);其中thresh為門限,在
?0,i2?threshi3???1,i2?thresh[0,255]之間
這里,i2_max=double(max(max(i2)));%獲取亮度最大值 i2_min=double(min(min(i2)));%獲取亮度最小值 thresh=round(i2_max-((i2_max-i2_min)/3));得到二值圖像,如圖4所示: 數字圖象處理
Digital Image Progressing
(圖4)
4.把二值圖像放大觀察,可看到離散的黑點
對其采用腐蝕膨脹處理,得到處理后的圖像,如圖5所示
(圖5)
可見,腐蝕膨脹處理后的圖像質量有了很大的改觀。
橫向、縱向分別的腐蝕膨脹運算比橫向、縱向同時的腐蝕膨脹運算好上很多,圖6可看出差別:
(圖6)
5.對腐蝕膨脹后的圖像進行Y方向上的區域選定,限定區域后的圖像如圖7所示:
掃描方法:中間往兩邊掃 數字圖象處理
Digital Image Progressing
(圖7)
縱向掃描后的圖像與原圖像的對照,如圖8所示:
(圖8)
6.對腐蝕膨脹后的圖像進行X方向上的區域選定,限定區域后的圖像如圖9所示:
掃描方法:兩邊往中間掃
(圖9)
縱向掃描后的圖像與原圖像的對照,如圖10所示:
(圖10)
7.調用i8=(iiXY~=1),使背景為黑色(0),字符為白色(1),便于后期處理。
背景交換后的圖像如圖11所示: 數字圖象處理
Digital Image Progressing
(圖11)
8.調用自定義函數(字符獲取函數)i9=getchar(i8),得到圖像如圖12所示:
(圖9)
9.調用自定義的字符獲取函數對圖像進行字符切割,并把切割的字符裝入一維陣列,切割
過程如圖12所示:
(圖12)
10.調用以下代碼,可將陣列word中的字符顯示出來,如圖13所示:
for j=1:cnum
%cnum為統計的字符個數
subplot(5,8,j),imshow(word{j}),title(int2str(j));%顯示字符
end 數字圖象處理
Digital Image Progressing
(圖13)
可以看到,字符寬度不一致
11.調用以下代碼,將字符規格化,便于識別:
for j=1:cnum
word{j}=imresize(word{j},[40 40]);%字符規格化成40×40的end 得到規格化之后的字符如圖14所示:
(圖14)
12.調用以下代碼創建字符集:
code=char('由于作者水平有限書中難免存在缺點和疏漏之處懇請讀批評指正。');
將創建的字符集保存在一個文件夾里面,以供匹配時候調用,如圖15所示: 數字圖象處理
Digital Image Progressing
(圖15)
13.字符匹配采用模板匹配算法:將現有字符逐個與模板字符相減,認為相減誤差最小的現
有字符與該模板字符匹配。
?1? 假設:字符A??0?0??1?001001001??1??0?,模板字符?1?T1?00????0?1??11001100?11???01?,模板字符T??2?00????1?0??011001101??0? ?0?1?? sum(sum(abs(A?T1)))?8,sum(sum(abs(A?T2)))?2 也就是說,字符A與模板字符T1更相似,我們可以認為字符集中的字符T2就是字符A。
經模板匹配,可得字符信息如下:
由于讀者書評有限書中難免存在缺點和紕漏之處,懇請讀者批評指正。效果如圖16所示:
(圖16)
14.調用以下代碼,將字符放入newtxt.txt文本: 數字圖象處理
Digital Image Progressing
new=['newtxt','.txt'];
c=fopen(new,'a+');
fprintf(c,'%sn',Code(1:cnum));
fclose(c);newtxt.txt文本內容如圖17所示:
(圖17)
五.反思與體會
1.算法具有局限性。對于左右結構的字符(如:川)容易造成誤識別,“川”字將會被識別
成三部分。當圖片中文字有一定傾斜角度時,這將造成識別困難。
2.模板匹配效率低。對于處理大小為m×m的字符,假設有n個模板字符,則識別一個字符至
少需要m×m×n×2次運算,由于漢字有近萬個,這將使得運算量十分巨大!此次字符識
別一共花了2.838秒。
3.伸縮范圍比較小。對于受污染的圖片,轉換成二值圖像將使字符與污染源混合在一起。
對于具體的圖片,需反復選擇合適的thresh進行二值化處理,甚至在處理之前必須進行
各種濾波。
4.通過這次數字圖象處理的學習和報告的撰寫,我們小組發揮了團結友愛的協作精神,大
量的資料查閱豐富了我們的視野,同時使我們對這么課更加感興趣。
參考文獻
[1] 樊昀,王潤生.從圖像中提取文字[J].國防科技大學學報,2002,24(1):59-62.[2] 王健,王晨.基于靜態圖片的文本提取技術的研究[J].延邊大學學報(自然科學版), 2007,33(2):124-128.[3] 夏瑩,馬少平,孫茂松等.計算機語言學方法在中文文字識別后處理中的應用[J].中文信息,1996,(2):50-51.[4] 鄭阿奇,曹戈,趙陽.MATLAB實用教程[M].北京:電子工業出版社
[5] 程衛國,馮峰,姚東,徐聽.MATLAB5.3應用指南[M].北京:人民郵電出版社 [6] 陳楊.MATLAB 6.X圖像編程與圖像處理[M].西安:西安電子科技大學出版社 數字圖象處理
Digital Image Progressing [7] 阮秋琦.數字圖像處理[M].電子工業出版社,2001年.[8] 徐建華.圖像處理與分析[M].科學出版社,1999年.附錄
主程序源代碼:
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%% 數字圖象處理大作業 %%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%————————圖片中文字的提取及識別————————%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% tic I=imread('字符.jpg');%打開圖片
%figure(1);imshow(I);title('原始圖像','color','b');
I=rgb2gray(I);%RGB圖片轉化成灰度圖像 %figure(2);imshow(I);title('灰度圖像','color','b');
i_max=double(max(max(I)));%獲取亮度最大值 i_min=double(min(min(I)));%獲取亮度最小值
thresh=round(i_max-((i_max-i_min)/3));%計算灰度圖像轉化成二值圖像的門限thresh I=(I>=thresh);%I為二值圖像
%figure(3);imshow(I);title('二值圖像','color','b');
seY=[1;1;1];%構造結構元素 I=imdilate(I,seY);%腐蝕圖像 I=imerode(I,seY);%膨脹圖像 seX=[1 1 1];I=imdilate(I,seX);I=imerode(I,seX);%figure(4);imshow(I);title('腐蝕膨脹后的圖像','color','b');
ii=double(I);[m,n]=size(ii);%獲取圖像大小信息 %確定文字區域 %縱向掃描
countY=zeros(m,1);for i=1:m
for j=1:n
if ii(i,j)==0 數字圖象處理
Digital Image Progressing
countY(i,1)=countY(i,1)+1;
end
end end
[maxY indexY]=max(countY);tempY1=indexY;while(countY(tempY1,1)>3)&&(tempY1>1)
tempY1=tempY1-1;end
tempY2=indexY;while(countY(tempY2,1)>3)&&(tempY2 tempY2=tempY2+1;end tempY1=tempY1-1;tempY2=tempY2+1;iiY=I(tempY1:tempY2,:);%確定了Y方向上的文字區域 %figure(5);imshow(iiY);title('Y方向區域大致確定后的圖像','color','b'); %橫向掃描 countX=zeros(1,n);for j=1:n for i=tempY1:tempY2 if ii(i,j)==0 countX(1,j)=countX(1,j)+1; end end end tempX1=1;while(countX(1,tempX1)<3)&&(tempX1 tempX1=tempX1+1;end tempX2=n;while(countX(1,tempX2)<3)&&(tempX2>1) tempX2=tempX2-1;end tempX1=tempX1-1;tempX2=tempX2+1;iiXY=iiY(:,tempX1:tempX2);%確定了整體的文字區域 %figure(6);imshow(iiXY);title('X、Y方向區域都大致確定后的圖像','color','b'); ii=(iiXY~=1);%黑色背景,白色字體 %figure(7);imshow(ii);title('背景和文字交換顏色的圖像','color','b'); ii=bwareaopen(ii,200);%刪除面積小于200的雜質圖像 數字圖象處理 Digital Image Progressing %figure(8);imshow(ii);title('刪除雜質干擾的圖像','color','b'); myI=charslice(ii);%限定文字區域 %figure(9);imshow(ii);title('限定文字區域的圖像','color','b'); y1=10;y2=0.25;flag=0;maxnum=40;k=1;%maxnum為字符個數限定值,k用于統計實際字符個數 word=cell(1,maxnum);%建立單元陣列,用于儲存字符 figure(10)while size(myI,2)>10 %當myI的長度小等于10,可確定沒有字符了 [word{k},myI]=getword(myI);%獲取字符 k=k+1; %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% if k==2 subplot(5,1,1);imshow(myI);title('第一次切割后的圖像','color','b'); end if k==3 subplot(5,1,2);imshow(myI);title('第二次切割后的圖像','color','b'); end if k==5 subplot(5,1,3);imshow(myI);title('第四次切割后的圖像','color','b'); end if k==16 subplot(5,1,4);imshow(myI);title('第十五次切割后的圖像','color','b'); end end subplot(5,1,5);imshow(myI);title('最后一次切割后的圖像','color','b');%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% cnum=k-1;%實際字符總個數 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% figure(11);for j=1:cnum subplot(5,8,j),imshow(word{j}),title(int2str(j));%顯示字符 end %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 數字圖象處理 Digital Image Progressing for j=1:cnum word{j}=imresize(word{j},[40 40]);%字符規格化成40×40的 end figure(12);for j=1:cnum subplot(5,8,j),imshow(word{j}),title(int2str(j));%顯示字符 end for j=1:cnum imwrite(word{j},[int2str(j),'.jpg']);%保存字符 end defx=40;defy=40;code=char('由于作者水平有限書中難免存在缺點和疏漏之處懇請讀批評指正。');%創建字符集 codenum=size(code,2);%獲取字符集中字符個數 for i=1:cnum ch=int2str(i);%數字轉化為字符 tempbw=imread([ch '.jpg']);%打開預匹配字符 for k=1:codenum fname=strcat('C:UsersAdministratorDesktop數字圖像處理大作業字符匹配庫',code(k),'.jpg');%字符匹配庫中的字符 sample=imread(fname); subsam=abs(tempbw-sample);%作比較 count=sum(sum(subsam));%匹配誤差統計 err(k)=count; end erro=err(1:codenum); minerror=min(erro);%找出誤差最小的模板字符 findc=find(erro==minerror);%獲取模板字符序號 Code(i)=code(findc);%將字符裝入Code end figure(13);imshow(ii);tt=title(['文字信息: ', Code(1:cnum)],'Color','b');%顯示字符信息 set(tt,'fontsize',24);%設置字體 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %將圖片文字寫入newtxt文本 new=['newtxt','.txt'];c=fopen(new,'a+'); fprintf(c,'%sn',Code(1:cnum));fclose(c);數字圖象處理 Digital Image Progressing t=toc charslice(字符分割)函數源代碼: %字符分割 function y=charslice(ii)[m,n]=size(ii);top=1;bottom=m;left=1;right=n;while sum(ii(top,:))==0 && top top=top+1;end while sum(ii(bottom,:))==0 && bottom>=1 bottom=bottom-1;end while sum(ii(:,left))==0 && left left=left+1;end while sum(ii(:,right))==0 && right>=1 right=right-1;end ydiff=bottom-top;xdiff=right-left;y=imcrop(ii,[left top xdiff ydiff]); getword(字符獲取)函數源代碼: %字符獲取 function [word,result]=getword(ii)word=[];flag=0;y1=8;y2=0.5;while flag==0 [m,n]=size(ii); wide=0; while sum(ii(:,wide+1))~=0 && wide<=n-2 wide=wide+1; end temp=charslice(imcrop(ii,[1 1 wide m])); [m1,n1]=size(temp); if wide ii(:,1:wide)=0; if sum(sum(ii))~=0 ii=charslice(ii);% 切割出最小范圍 else word=[];flag=1; end else word=charslice(imcrop(ii,[1 1 wide m])); ii(:,1:wide)=0;數字圖象處理 Digital Image Progressing if sum(sum(ii))~=0; ii=charslice(ii); flag=1; else ii=[]; end end end result=ii; www.tmdps.cn 阿彌陀佛守護神的圖片,怎么識別阿彌陀佛 佛教理論認為人人都是可以成佛的,所以佛經中的佛菩薩不計其數,但地位最高功德最大的就是三世佛了,而其中的橫三世佛包括主管東方琉璃光世界的藥師佛、主管中央婆娑世界的釋迦牟尼佛和主管西方極樂世界的阿彌陀佛,他們可以說是佛教中地位最崇高的佛,本文就通過阿彌陀佛守護神的圖片來說一說阿彌陀佛。 很多人都聽過阿彌陀佛,因為都知道“南無阿彌陀佛”這句佛教的口頭禪,的確此佛教的六字洪名的確是源于阿彌陀佛的佛號的,而根據本命佛的說法,阿彌陀佛守護屬豬和屬狗,被稱為是這兩個生肖的守護神。 我們結緣自己的本命佛最好都是正規的開光的,只有通過佛教開光儀式的本命佛才可以從緣主的運勢上真正的幫助緣主。吉照堂本命佛因為開光的正規性,成就了超高的靈驗度,以真正的靈性得到了緣主的信賴,這里的阿彌陀佛守護神的圖片便是實物圖片,可見其材質和外觀的精美。 吉照堂本命佛開光后能更好的幫助緣主聚集財富和福氣,讓你在事業上一帆風順,走到更好的事業巔峰。佩戴吉照堂本命佛可以去除身邊的邪氣災難,更好的幫助緣主聚集天地靈氣,讓我們的心境也更加的開闊和光明,我們內心自然而然也會更加的愉悅和歡欣。吉照堂本命 www.tmdps.cn 佛在默默守護你的同時,也會庇佑家人逢兇化吉,闔家安樂。 從上面我們知道了阿彌陀佛的地位,我們常說的修佛百年之后得歸凈土就是前往阿彌陀佛建立的西方凈土世界,在那個沒有煩惱、人人幸福的世界接受阿彌陀佛的指引。 從阿彌陀佛守護神的圖片可以看出此佛的造像特點,就是有“卍”字,這是佛教的標準文字,象征永恒和圓滿,所以造型上有此標準的佛就是阿彌陀佛。阿彌陀佛最大的功德就是建立西方的凈土世界,成為每一位求佛者心向往之的地方。而且阿彌陀佛還發四十八大愿,也稱為佛教的重要理論,特別是“南無阿彌陀佛”的流傳就是因為此佛的大愿,意思是我愿意接受無限的光明,無限的智慧,無限的壽命。 www.tmdps.cn 從上面阿彌陀佛守護神的圖片可以看出做工的精美,無論是擺件、吊墜還是手鏈,都是非常美觀的。而且他同時守護了生肖豬和生肖狗兩個生肖,這兩個生肖的緣主都是可以結緣奉請此本命佛的,佛一定會幫助您彌補運勢中的不足,感知到您真心的訴求,讓您心想事成。您可以根據自己對本命佛材質以及色澤的偏愛,結緣自己最喜歡的,佛教的歡喜心可以成就更多的契緣,可以讓您的本命佛更加靈驗,改運納福的效果更好。 以ion, age, ness, ty, ship, ace, ance, ancy, ence, ency, dom, itude, um, mony 結尾的大都是名詞; 以ize, ise, fy結尾的大都是動詞; 以ive, ent, ant, ful, ous, able, ary, ic, cal, less結尾的是大都是形容詞; 以ly, s, ways, wise 結尾的大都是副詞。 1.名詞后綴 1)-or/er/ess/crat/cis:做某件事情或職業的人或物:worker, debtor ,actress, democrat,2)-acy, 表示“性質,狀態,境遇” democracy, accuracy, diplomacy 3)-ance,-ence表示“性質,狀況,行為,過程,總量,程度” importance, diligence, difference, obedience 4)-ancy,-ency, 表示”性質,狀態,行為,過程“ frequency, urgency, efficiency,5)-bility, 表示”動作,性質,狀態“ possibility, flexibility, feasibility,6)-dom, 表示”等級,領域,狀態“ freedom, kingdom, wisdom 7)-hood, 表示”資格,身份, 年紀,狀態“ childhood, manhood, falsehood 8)-ion,-sion,-tion,-ation,-ition, 表示”行為的過程,結果,狀況“ action, solution, conclusion, destruction, expression, correction 9)-ism, 表示”制度,主義,學說,信仰,行為“ socialism, criticism, colloquialism, heroism 10)-ity, 表示”性質,狀態,程度” purity, reality, ability, calamity 11)-ment, 表示“行為,狀態,過程,手段及其結果 treatment, movement, judgment, punishment, argument 12)-ness, 表示”性質,狀態,程度“ goodness, kindness, tiredness, friendliness 13)-ship, 表示”情況,性質,技巧,技能及身份,職業” hardship, membership, friendship 14)-th, 表示“動作,性質,過程,狀態” depth, wealth, truth, length, growth 15)-tude, 表示“性質,狀態,程度” latitude, altitude(海拔) 16)-ure, 表示“行為,結果” exposure, pressure, failure, procedure(手續),17-grapy, 表示“??學,寫法” biography, calligraphy, geography 18)-ic, ics, 表示“??學??法” logic, mechanics, electronics, linguistics 19)-ology, 表示“??學??論”biology, zoology, technology(工藝學) 20)-nomy, 表示“??學??術” astronomy(天文學), economy, bionomy(生態學) 2.形容詞后綴 (1)帶有“屬性,傾向,相關”的含義 1)-able,-ible, visible, flexible2)名詞-ish, foolish, bookish, selfish(注意accomplish, vanish) 3)-ive, active, sensitive, productive 4)-like, manlike, childlike 5)名詞-ly, manly, fatherly, scholarly, motherly 6)-some, troublesome, handsome 7)-ful, beautiful, wonderful, helpful, truthful 8)-ous, dangerous, generous, courageous, various9)-ent, violent 10)-most, foremost, topmost(11)less, 表示否定,countless, stainless, wireless 3.動詞后綴 1)-ize, ise, 表示“做成,變成,??化“modernize, mechanize, democratize, organize 2)-en, 表示”使成為,引起,使有” quicken, weaken, soften, harden 3)-fy, 表示“使??化, 使成”beautify, purify, intensify, signify, simplify 4)-ish, 表示”使,令” finish, abolish, diminish, establish 5)-ate, 表示“成為??,處理,作用” separate, operate, indicate 4.副詞后綴 (形容詞)-ly:bad→badly壞地/惡劣地,careful→carefully小心地 -wise(OE):clock→clockwise(a./adv.)順時針方向的(地);like→likewise同樣地-wards:out→outwards向外面地,north→northwards向北方地 來源第四篇:阿彌陀佛守護神的圖片,怎么識別阿彌陀佛
第五篇:單詞后綴整理