發布時間:所屬分類:計算機職稱論文瀏覽:1次
摘 要: 摘 要: 目的 工業產品的表面缺陷對產品的美觀度、舒適度和使用性能等帶來不良影響,所以生產企業對產品的表面缺陷進行檢測以便及時發現并加以控制。機器視覺的檢測方法可以很大程度上克服人工檢測方法的抽檢率低、準確性不高、實時性差、效率低、勞動強度大等弊端,在
摘 要: 目的 工業產品的表面缺陷對產品的美觀度、舒適度和使用性能等帶來不良影響,所以生產企業對產品的表面缺陷進行檢測以便及時發現并加以控制。機器視覺的檢測方法可以很大程度上克服人工檢測方法的抽檢率低、準確性不高、實時性差、效率低、勞動強度大等弊端,在現代工業中得到越來越廣泛的研究和應用。方法 以機器視覺表面缺陷檢測為研究對象,在廣泛調研相關文獻和發展成果的基礎上,對基于機器視覺在表面缺陷檢測領域的應用進行了綜述。分析了典型機器視覺表面缺陷檢測系統的工作原理和基本結構,闡述了表面缺陷視覺檢測的研究現狀、現有視覺軟件和硬件平臺,綜述了機器視覺檢測所涉及到的圖像預處理算法、圖像分割算法、圖像特征提取及其選擇算法、圖像識別等相關理論和算法研究,并對每種主要方法的基本思想、特點和存在的局限性進行了總結,對未來可能的發展方向進行展望。結果 機器視覺表面缺陷檢測系統中,圖像處理和分析算法是重要內容,算法各有優缺點和其適應范圍。如何提高算法的準確性、實時性和魯棒性,一直是研究者們努力的方向。結論機器視覺是對人類視覺的模擬,機器視覺表面檢測涉及眾多學科和理論,如何使檢測進一步向自動化和智能化方向發展,還需要更深入的研究。
關鍵詞: 機器視覺; 表面缺陷; 檢測算法; 圖像處理; 圖像識別
0 引 言
中國是一個制造大國,每天都要生產大量的工業產品。用戶和生產企業對產品質量的要求越來越高,除要求滿足使用性能外,還要有良好的外觀,即良好的表面質量。但是,在制造產品的過程中,表面缺陷的產生往往是不可避免的。不同產品的表面缺陷有著不同的定義和類型,一般而言表面缺陷是產品表面局部物理或化學性質不均勻的區域,如金屬表面的劃痕、斑點、孔洞,紙張表面的色差、壓痕,玻璃等非金屬表面的夾雜、破損、污點,等等。表面缺陷不僅影響產品的美觀和舒適度,而且一般也會對其使用性能帶來不良影響,所以生產企業對產品的表面缺陷檢測非常重視,以便及時發現,從而有效控制產品質量,還可以根據檢測結果分析生產工藝中存在的某些問題,從而杜絕或減少缺陷品的產生,同時防止潛在的貿易糾份,維護企業榮譽。
人工檢測是產品表面缺陷的傳統檢測方法,該方法抽檢率低、準確性不高、實時性差、效率低、勞動強度大、受人工經驗和主觀因素的影響大,而基于機器視覺的檢測方法可以很大程度上克服上述弊端。
美國機器人工業協會( RIA) 對機器視覺下的定義為: “機器視覺是通過光學的裝置和非接觸的傳感器自動地接收和處理一個真實物體的圖像,以獲得所需信息或用于控制機器人運動的裝置”[1]。
機器視覺是一種無接觸、無損傷的自動檢測技術,是實現設備自動化、智能化和精密控制的有效手段,具有安全可靠、光譜響應范圍寬、可在惡劣環境下長時間工作和生產效率高等突出優點。機器視覺檢測系統通過適當的光源和圖像傳感器( CCD 攝像機) 獲取產品的表面圖像,利用相應的圖像處理算法提取圖像的特征信息,然后根據特征信息進行表面缺陷的定位、識別、分級等判別和統計、存儲、查詢等操作。
視覺表面缺陷檢測系統基本組成主要包括圖像獲取模塊、圖像處理模塊、圖像分析模塊、數據管理及人機接口模塊。
圖像獲取模塊由 CCD 攝像機、光學鏡頭、光源及其夾持裝置等組成,其功能是完成產品表面圖像的采集。在光源的照明下,通過光學鏡頭將產品表面成像于相機傳感器上,光信號先轉換成電信號,進而轉換成計算機能處理的數字信號。目前工業用相機主要基于 CCD 或 CMOS( complementary metal oxide semiconductor) 芯片的相機。CCD 是目前機器視覺最為常用的圖像傳感器。
光源直接影響到圖像的質量,其作用是克服環境光干擾,保證圖像的穩定性,獲得對比度盡可能高的圖像。目前常用的光源有鹵素燈、熒光燈和發光二級管( LED) 。LED 光源以體積小、功耗低、響應速度快、發光單色性好、可靠性高、光均勻穩定、易集成等優點獲得了廣泛的應用。
由光源構成的照明系統按其照射方法可分為明場照明與暗場照明、結構光照明與頻閃光照明。明場與暗場主要描述相機與光源的位置關系,明場照明指相機直接接收光源在目標上的反射光,一般相機與光源異側分布,這種方式便于安裝; 暗場照明指相機間接接收光源在目標上的散射光,一般相機與光源同側分布,它的優點是能獲得高對比度的圖像。結構光照明是將光柵或線光源等投射到被測物上,根據它們產生的畸變,解調出被測物的 3 維信息。頻閃光照明是將高頻率的光脈沖照射到物體上,攝像機拍攝要求與光源同步。
圖像處理模塊主要涉及圖像去噪、圖像增強與復原、缺陷的檢測和目標分割。
由于現場環境、CCD 圖像光電轉換、傳輸電路及電子元件都會使圖像產生噪聲,這些噪聲降低了圖像的質量從而對圖像的處理和分析帶來不良影響,所以要對圖像進行預處理以去噪。圖像增強目是針對給定圖像的應用場合,有目的地強調圖像的整體或局部特性,將原來不清晰的圖像變得清晰或強調某些感興趣的特征,擴大圖像中不同物體特征之間的差別,抑制不感興趣的特征,使之改善圖像質量、豐富信息量,加強圖像判讀和識別效果的圖像處理方法。圖像復原是通過計算機處理,對質量下降的圖像加以重建或復原的處理過程。圖像復原很多時候采用與圖像增強同樣的方法,但圖像增強的結果還需要下一階段來驗證; 而圖像復原試圖利用退化過程的先驗知識,來恢復已被退化圖像的本來面目,如加性噪聲的消除、運動模糊的復原等。圖像分割的目的是把圖像中目標區域分割出來,以便進行下一步的處理。
圖像分析模塊主要涉及特征提取、特征選擇和圖像識別。
特征提取的作用是從圖像像素中提取可以描述目標特性的表達量,把不同目標間的差異映射到低維的特征空間,從而有利于壓縮數據量、提高識別率。表面缺陷檢測通常提取的特征有紋理特征、幾何形狀特征、顏色特征、變換系數特征等,用這些多信息融合的特征向量來區可靠地區分不同類型的缺陷; 這些特征之間一般存在冗余信息,即并不能保證特征集是最優的,好的特征集應具備簡約性和魯棒性,為此,還需要進一步從特征集中選擇更有利于分類的特征,即特征的選擇。圖像識別主要根據提取的特征集來訓練分類器,使其對表面缺陷類型進行正確的分類識別。
數據管理及人機接口模塊可在顯示器上立即顯示缺陷類型、位置、形狀、大小,對圖像進行存儲、查詢、統計等。
機器視覺表面缺陷檢測主要包括 2 維檢測和 3 維檢測,前者是當前的主要表面缺陷檢測方式,也是本文的著重論述之處。
機器視覺在工業檢測、包裝印刷、食品工業、航空航天、生物醫學工程、軍事科技、智能交通、文字識別等領域得到了廣泛的應用。工業檢測領域是機器視覺應用中比重最大的領域,主要用于產品質量檢測、產品分類、產品包裝等,如: 零件裝配完整性檢測,裝配尺寸精度檢測,位置/角度測量,零件識別, PCB 板檢測,印刷品檢測,瓶蓋檢測,玻璃、煙草、棉花檢測,以及指紋、汽車牌照、人臉、條碼等識別。表面質量檢測系統是工業檢測的極其重要的組成部分,機器視覺表面缺陷檢測在許多行業開始應用,涉及鋼板[2-4]、玻璃[5-6]、印刷[7-9]、電子[10]、紡織品[11]、零件[12-13]、水果[14]、木材[15-16]、瓷磚[17-19]、鋼軌[20]等多種關系國計民生的行業和產品。
1 研 究 現 狀、視覺軟件系統和研究平臺
1. 1 研究現狀
機器視覺在金屬( 特別是鋼板) 表面、紙張等印刷品、紡織品、磁磚、玻璃、木材等表面缺陷檢測國內外有較多的研究成果,不乏成功應用系統和案例。
在鋼板表面缺陷檢測領域,美國 Westinghouse 公司采用線陣 CCD 攝像機和高強度的線光源檢測鋼板表面缺陷,并提出了將明域、暗域及微光域 3 種照明光路形式組合應用于檢測系統的思路[21]。這些系統可識別的缺陷種類相對較少,并且不具備對周期性缺陷的識別能力。美國 Cognex 公司研制成功了 iS - 2000 自動檢測系統和 iLearn 自學習分類器軟件系統[22]。這兩套系統配合有效改善了傳統自學習分類方法在算法執行速度、數據實時吞吐量、樣本訓練集規模及模式特征自動選擇等方面的不足; Parsytec 公司為韓國浦項制鐵公司研制了冷軋鋼板表面缺陷檢測系統 HTS,該系統能對高速運動的熱軋鋼板表面缺陷進行在線自動檢測和分級的系統,在連 軋 機 和 CSP 生產線上取得了良好的效果[23]; 英國 European Electronic System 公司研制的 EES 系統也成功地應用于熱連軋環境下的鋼板質量自動檢測[24]。EES 系統實時地提供高清晰度、高可靠性的鋼板上下表面的缺陷圖像,最終交由操作員進行缺陷類型的分類判別。國內北京科技大學的高效軋制國家工程研究中心也在進行鋼板表面質量檢測系統的研制,對其常見缺陷類型進行了檢測與識別,取得了一定的研究成果[25],東北大學、上海寶鋼集團公司、武漢科技大學等科研院所研究了冷軋鋼板表面缺陷的檢測系統[26-28],重慶大學對高溫連鑄坯表面缺陷進行了研究[29]。
在其他領域,視覺表面缺陷檢測也得到了廣泛的研究和應用。文獻[30]對規則紋理表面( 天然木材、機械加工表面、紡織面料) 的表面缺陷采用傅里葉變換進行圖像的復原,高頻的傅里葉分量對應表面紋理線型,而低頻的傅里葉分量對應表面缺陷區域。文獻[31]研究了鋁帶連鑄生產中的表面缺陷檢測,通過紅外檢測提供鋁帶表面溫度的分布情況以評估鋁帶質量,采集鋁帶圖像,進行表面缺陷檢測和分類。文獻[32]將機器視覺應用于集成電路晶片表面缺陷檢測,使用模糊邏輯對表面凹坑缺陷的不同形狀進行分析處理。文獻[33]利用圖像對鐵軌的表面質量進行自動檢測,車載檢測系統對鐵軌的表面質量進行實時檢測和分類。文獻[34]基于機器視覺系統對雞肉包裝前的質量檢測,根據雞肉圖像的顏色信息,采用數學形態學方法對潛在的問題區域進行特征提取,然后按預定義的質量問題列表進行分類。文獻[35]針對隨機紋理的彩色圖像提出了一種利于分水嶺變換的顏色相似性度量,提取了圖像的顏色和紋理特征,實現了隨機紋理表面缺陷的自動分割和檢測。文獻[36]采用雙目立體視覺,基于特征立體匹配算法對掃描電鏡圖像研究了物體的表面深度信息。文獻[37]介紹了一種皮革表面缺陷檢測的方法,采用 OTSU 方法進行缺陷分割,利用歐式距離聚類法進行缺陷分類,在分類聚類時使用形態學算子進行腐蝕運算,實驗結果表明了該方法的有效性。文獻[38]對玻璃缺陷進行了識別,把采集到的缺陷圖像縮放到 10 × 10 的大小,然后把這個 100 個像素值作為特征向量,分別運用徑向基( RBF) 神經網絡和決策樹進行識別; 該方法的缺點是不同缺陷縮放后造成部分信息的丟失。文獻[39]研究了一種玻璃缺陷識別的專家系統( ES) ,首先需要電子顯微技術和等離子射線獲得缺陷信息作為知識庫,對未知的玻璃缺陷通過搜索知識庫對缺陷信息進行匹配,選擇最相近的類別作為輸出; 該方法的缺點是分類采用貪婪搜索法,匹配速度慢。文獻[40]針對機器視覺在產品表面粗糙度的檢測方法作了描述,首先建立粗糙度的模型,然后以表面的累加偏差作為特征通過神經網絡( ANN) 進行等級劃分,并闡述了不同的 ANN 模型對識別結果的影響。
1. 2 視覺軟件系統
機器視覺軟件系統除具有圖像處理和分析功能外,還應具有界面友好、操作簡單、擴展性好、與圖像處理專用硬件兼容等優點。國外視覺檢測技術研究開展的較早,已涌現了許多較為成熟的商業化軟件,應該 比 較 多 的 有 HALCON、HexSight、Vision Pro、 LEADTOOLS 等[41]。
HALCON 是德國 MVtec 公司開發的一套完善的標準的機器視覺算法包,擁有應用廣泛的機器視覺集成開發環境維視圖像開發定制軟件,在歐洲以及日本的工業界已經是公認具有最佳效能的 Machine Vision 軟件。HALCON 的 image processing library,由一千多個各自獨立的函數和底層的數據管理核心構成,其函數庫可以用 C,C + + ,C#,Visual basic 和 Delphi 等多種普通編程語言訪問。HALCON 百余種工業相機和圖像采集卡提供接口,包括 GenlCam,GigE 和 IIDC 1394。HALCO 還具有強大的 3 維視覺處理能力,另 外,自動算子并行處 理 ( AOP) 技術是 HALCON 的一個獨特性能。HALCON 應用范圍涵蓋自動化檢測、醫學和生命科學,遙感探測,通訊和監控等眾多領域。
Adept 公司出品的 HexSight 是一款高性能的、綜合性的視覺軟件開發包,它提供了穩定、可靠及準確定位和檢測零件的機器視覺底層函數。HexSight 的定位工具是根據幾何特征、采用輪廓檢測技術來識別對象和模式。在圖像凌亂、亮度波動、圖像模糊和對象重疊等方面有顯著效果。HexSight 能處理自由形 狀 的 對 象,并具有功能強大的去模糊算法。 HexSight 軟件包含一個完整的底層機器視覺函數庫,可用來建構完整的高性能 2D 機器視覺系統,可利用 Visual Basic、Visual C + + 或 Borland Dephi 平臺方便地進行二次開發。其運算速度快,在一臺 2 GHz 的處理器上尋找和定位一般的零部件不超過 10 ms; 具有 1 /40 亞像素平移重復精度和 0. 05 度旋轉重復精度。此外,內置的標定模塊能矯正畸變、投影誤差和 X - Y 像素比誤差,完整的檢測工具包含硬件接口、圖像采集、圖像標定、圖像預處理、幾何定位、顏色檢測、幾何測量、Blob 分析、清晰度評價( 自動對焦) 、模式匹配、邊緣探測等多種多樣,開放式體系結構,支持 DirectShow、DCam,GigE vision 等多種通用協議,幾乎與市面上所有商業圖像采集卡,以及各種 USB、1394 以及 GigE 接口的攝像機兼容。
Cognex 公司的 VisionPro 是一套基于. Net 的視覺工具,適用于包括 FireWire 和 CameraLink 在內的所有硬件平臺,利用 ActiveX 控制可快速完成視覺應用項目程序的原模型開發,可使用相應的 Visual Basic、VB. Net、C#或 C + + 搭建出更具個性化的應用程序。
LEADTOOLS 在數碼圖像開發工具領域中已成為全球領導者之一,是目前功能強大的優秀的圖形、圖像處理開發包,它可以處理各種格式的文件,并包含所有圖形、圖像的處理和轉換功能,支持圖形、圖像、多媒體、條形碼、OCR、Internet、DICOM 等等,具有各種軟硬件平臺下的開發包。
此外,還有 Dalsa 公司的 Sherlock 檢測軟件,日本的 OMRON 和 Keyence,德國 SIEMENS 等,這些機器視覺軟件都能提供完整的表面缺陷檢測方法。
國內機器視覺檢測系統開發較晚,相關的企業主要是代理國外同類產品,提供視覺檢測方案和系統集成,其中具有代表性的企業有凌華科技、大恒圖像、視覺龍、凌云光子、康視達、OPT、三姆森和微視圖像等。
1. 3 視覺硬件平臺
機器視覺表面質量檢測,特別是實時檢測,圖像采集的數據量大,所以如何提高圖像處理速度顯得十分重要。提高圖像處理速度主要有兩種手段,一是改善和優化圖像處理算法,算法既要簡單快速,又要兼顧實際效果; 二是改善和優化實現算法的手段。目前,實時圖像處理采集方案主要為下面幾個方面[42]。
1) 通用計算機網絡并行處理。這種處理結構采用“多客戶機 + 服務器”的方式,一個圖像傳感器對應一臺客戶機,服務器實現信息的合成,圖像處理的大部分工作由軟件來完成。該結構雖然比較龐大,但升級維護方便、實時性較好。
2) 數字信號處理器( DSP) 。DSP 是一種獨特的微處理器,是以數字信號來處理大量信息的器件。其工作原理是將接收到的模擬信號轉換為“0”或 “1”的數字信號,再對數字信號進行修改、刪除和強化,并在其他系統芯片中把數字數據解譯回模擬數據或實際環境格式,其實時運行速度遠遠超過通用微處理器。但是,DSP 的體系仍是串行指令執行系統,而且只是對某些固定的運算進行硬件優化,故不能滿足眾多的算法要求。
3) 專用集成電路( ASIC) 。ASIC 是針對于某一固定算法或應用而專門設計的硬件芯片,有很強的實時性。但在實際應用中存在開發周期相對較長、成本高、適應性和靈活性差等缺點。
4) 現場可編程門陣列( FPGA) 。FPGA 由多個可編程的基本邏輯單元組成的一個 2 維矩陣,邏輯單元之間以及邏輯單元與 I/O 單元之間通過可編程連線進行連接。FPGA 能在設計上具有很強的靈活性,集成度、工作速度也在不斷提高,可實現的功能也越來越強; 同時其開發周期短,系統易于維護和擴展,能夠大大地提高圖像數據的處理速度。
實時圖像處理系統中,底層的信號數據量大,對處理速度的要求高,但運算結構相對比較簡單,適合采用 FPGA 以硬件方式來實現; 高層處理算法的特點是處理的數據量相對較少,但算法和控制結構復雜,可使用 DSP 來實現。所以,可以把二者的優點結合在一起以兼顧實時性和靈活性。
USB、串口、并口是計算機和外設進行通訊的常用接口,但對于數據量大的圖像來說,串行 RS - 232 協議難于達到圖像采集實時性要求。USB 口即使能滿足所需速度,但要求外設必須支持 USB 協議,而 USB 協議與常用工程軟件的接口還不普及。 IEEE - 1394 接口具有廉價,速度快,支持熱拔插,數據傳輸速率可擴展,標準開放等特點,在眾多領域得到了廣泛的應用。但隨著數字圖像采集速度的提高、數據量的增大,原有的標準漸難以滿足需求。為了簡化數據的連接,實現高速、高精度、靈活、簡單的連接,在 National Semiconductor 公司等多家相機制造商共同制定推出了 Camera Link 標 準。Camera Link 是專門為數字攝像機的數據傳輸提出的接口標準,專為數字相機制定的一種圖像數據、視頻數據控制信號及相機控制信號傳輸的總線接口,其最主要特點是采用了低壓差分信號 ( LVDS) 技術,使攝像機的數據傳輸速率大大提高。
2 表面缺陷檢測圖像處理和分析算法
2. 1 圖像預處理算法
工業現場采集的圖像通常包含噪聲,圖像預處理主要目的是減少噪聲,改善圖像的質量,使之更適合人眼的觀察或機器的處理。圖像的預處理通常包括空域方法和頻域方法,其算法有灰度變換、直方圖均衡、基于空域和頻域的各種濾波算法等,其中直觀的方法是根據噪聲能量一般集中于高頻,而圖像頻譜則分布于一個有限區間的這一特點,采用低通濾波方式進行去噪,例如滑動平均窗濾波器、Wiener 線性濾噪器等。上述各種濾波方法中,頻域變換復雜,運算代價較高; 空域濾波算法采用各種模板對圖像進行卷積運算。直接灰度變換法通過對圖像每一個像素按照某種函數進行變換后得到增強圖像,變換函數一般多采用線性函數、分段線性函數、指數函數、對數函數等,運算簡單,在滿足處理功能的前提下實時性也較高。近年來,數學形態學方法[43-44]、小波 方 法[45-47] 用于圖像的去噪,取 得 了 較 好 的效果。
2. 2 圖像分割算法
圖像的分割是把圖像陣列分解成若干個互不交迭的區域,每一個區域內部的某種特性或特征相同或接近,而不同區域間的圖像特征則有明顯差別。它是由圖像處理到圖像分析的關鍵步驟。現有的圖像分割方法主要分為基于閾值的分割方法、基于區域的分割方法、基于邊緣的分割方法以及基于特定理論的分割方法等。近年來,研究者不斷改進原有的圖像分割方法并把其他學科的一些新理論和新方法用于圖像分割,提出了不少新的分割方法。圖像分割后提取出的目標可以用于圖像語義識別、圖像搜索等領域。
2. 2. 1 基于區域的分割算法
基于區域的分割算法包括閾值分割法、區域生長法和聚類分割法等。
閾值分割法是一種傳統的圖像分割方法,其基本原理是: 通過設定不同的灰度閾值,把圖像像素點分為若干類。因其實現簡單、計算量小、性能較穩定而成為圖像分割中最基本和應用最廣泛的分割方法,其中閾值的選取是圖像閾值分割方法中的關鍵。
關于閾值的確定方法,目前比較常用的有固定閾值法、自適應閾值法、多區域閾值法等。固定閾值分割算法實時性強,適用于圖像背景和目標灰度值區別明顯的情況; 自適應閾值分割算法,適用于目標與背景的灰度值區別不明顯的情況; 多區域閾值法,適用于目標與背景在不同區域區別較大的情況。
Otsu 提出了動態門限方法[48],它以目標和背景之間的方差最大來動態地確定圖像分割門限值,但當目標的相對面積較小時,此方法性能不佳。Pun 和 Kapur 等人提出了利用最大先驗熵選取閾值的方法[49-50],從信息論的角度選擇閾值,在一定程度上克服了上述算法的缺點,但當圖像背景復雜時分割時容易喪失部分信息,且計算量較大。
Yen 等人提出了利用最大相關性原則取代常用的最大熵原則來選取閾值的方法[51],以及基于一維或 2 維直方圖的閾值方法[52-54]、最小誤判概率準則下的最佳閾值方法[55]在其后也被提出。
區域生長法的基本思想是依據一定的生長準則,將若干個“相似”子區域聚合成較大的區域。它首先對每個需要分割的區域找到一個種子像素作為生長的起點,再將種子像素鄰域中與其具有相同或相似性質的像素根據某種事先確定的準則合并到種子像素所在的區域中; 將這些新像素當作新的種子像素繼續像上面的操作,直到再沒有滿足條件的像素可包括進來。此法原理簡單,對于較均勻的連通目標有較好的分割效果; 缺點是依賴于初始條件的選取,計算量較大,不適用于實時檢測。
分裂—合并法也是一種基于區域的分割算法,其基本思想是: 根據圖像和各區域的不均勻性,將圖像或區域分裂成新的子區域,再將包含相同內容的區域合并成新的較大區域,最后得到分割圖像。四叉樹分解是一種常用的分裂—合并法,其具體過程是: 將圖像分成 4 塊大小相等的方塊,判斷每個小塊是否滿足一致性標準( 如兩區域參數統計特征結果相同,等等) 。若滿足,則不再分解; 若不滿足,則再細分成四塊,再用細分塊進行一致性標準檢查,直到滿足一致性標準,結果可能包含大小不同的塊。
聚類法進行圖像分割是根據圖像在特征空間的聚集對特征空間進行分割,再映射到原圖像空間得到分割結果,K 均 值 聚 類 算 法、模 糊 C 均 值 聚 類 ( FCM) 算法[56 - 57]是常用的聚類算法。
2. 2. 2 基于邊緣的分割方法
基于邊緣的分割方法其實就是根據圖像中局部特性的不連續性而采用某種算法來提取出圖像中的對象與背景間的交界線。
相關知識推薦:論文發表sci期刊需要多久
邊緣處像素的灰度值不連續,這種不連續性可通過求導來檢測。經典的邊緣檢測算法一般采用微分的方法進行計算,常用的一階微分邊緣檢測算子有 Robert 算子、Sobel 算子、Prewitt 算子、Kirsch 算子等幾種。一階微分算子方法計算簡便、速度快,但定位不準確。二階微分算子主要有 Canny 算子、Log 算子、Laplacian 算子,這類算子基于一階導數的局部最大值對應二階導數的零交叉點這一性質,通過尋找圖像灰度的二階導數的零交叉點從而定位邊緣。二階微分算子方法邊緣定位準確,但對噪聲敏感。對于噪聲污染的圖像,在進行微分算子邊緣檢測前一般先要濾波,但濾波的同時也使圖像邊緣產生一定程度的模糊。Marr 算子將噪聲濾波與邊緣提取相結合,但當模板較小時抗噪性能不良,模板較大時計算費時。
2. 2. 3 基于特定理論的分割方法
隨著數學和人工智能的發展,出現了一些新的邊緣檢測方法,如數學形態學法、小波變換法、人工神經網絡法、遺傳算法、基于模糊理論的算法等。 20 世紀 90 年代初,Mallat 在圖像多分辨分析理論的基礎上,提出了小波變換局部模極大值邊緣檢測方法[58-59],在噪聲圖像中取得了較好的邊緣檢測效果。后來,人們在 Mallat 理論框架下,提出了多尺度邊緣檢測方法[60]。多尺度邊緣檢測方法主要思想在較大的尺度下能對邊緣精確檢測,而在較小的尺度下能對邊緣點精確定位。小波變換的突出優點是其多分辨率,圖像的每個尺度的小波變換都提供了一定的邊緣信息。小波分析在時域和頻域都具有良好的局部化性質,可聚焦到對象的任意細節,是圖像處理領域的熱點。雖然人們提出了多種的邊緣檢測方法[61-62],但邊緣檢測時抗噪性和檢測精度的矛盾仍然是要研究的重點內容之一。
基于數學形態學邊緣檢測方法[63-64]的基本思想是用具有一定形態的結構元素提取圖像中的對應形狀,以達到對圖像分析和識別的目的。采用多結構元素的數學形態學算法,既能提取細小邊緣,又能很好的抑制噪聲,結構元素選取靈活,但在靈活的同時也導致算法的適應性變差。
近年來有一些新的研究手段如神經網絡、遺傳算法和小波方法等被引入到圖像分割的閾值選取中[65-69],其效果仍在探索之中。
雖然有許多圖像分割的方法,這些算法的共性問題在于分割精度與抗噪性的矛盾,同時,高實時性處理算法的研究遠遠滯后于通用圖像處理算法的研究,應用于實際生產中的一些算法在準確性、實時性和可操作性上也還存在較大的困難。至今,圖像分割算法大都是針對具體問題所提出的,雖然每年都有新的圖像分割算法提出,但是并沒有一種通用的算法能適用于所有的圖像分割處理。——論文作者:湯勃,孔建益,伍世虔