機(jī)器視覺,如何賦予改變未來的想象?

發(fā)布時(shí)間：2023-04-28 | 信息來源：上海硯拓自動化科技有限公司 | 點(diǎn)擊量：853

隨著信息技術(shù)的發(fā)展，給計(jì)算機(jī)、機(jī)器人或其他智能機(jī)器賦予人類視覺功能，成為人類多年以來的夢想。

視覺是人類觀察世界和認(rèn)知世界的重要手段。據(jù)統(tǒng)計(jì)，人類從外部世界獲得的信息約有80%是由提覺獲取的。這既說明視覺信息量巨大，也表明人類對視覺信息有較高的利用率，同時(shí)又體現(xiàn)了人類視覺功能的重要性。隨著信息技術(shù)的發(fā)展，給計(jì)算機(jī)、機(jī)器人或其他智能機(jī)器賦予人類視覺功能，成為人類多年以來的夢想。

目前許多機(jī)器視覺技術(shù)已經(jīng)實(shí)現(xiàn)了產(chǎn)品化、實(shí)用化。例如，指紋識別、車牌照識別、智能監(jiān)控、人臉識別、工業(yè)產(chǎn)品的在線檢測等。可以說，機(jī)器視覺技術(shù)在信息化時(shí)代，扮演著越來越重要的角色。

什么是機(jī)器視覺？

機(jī)器視覺(machinevision)又常被稱作為計(jì)算機(jī)視覺(computervision)，是用計(jì)算機(jī)實(shí)現(xiàn)人的視覺功能一一對客觀世界的三維場景的感知、識別和理解。

自20世紀(jì)50年代從統(tǒng)計(jì)模式識別開始的，計(jì)算機(jī)視覺當(dāng)時(shí)的工作主要集中在二維圖像分析、識別和理解上，如光學(xué)字符識別、工件表面、顯微圖片和航空照片的分析和解釋等。1973年，英國的Marr教授應(yīng)邀在麻省理工學(xué)院（MIT）的人工智能實(shí)驗(yàn)室創(chuàng)建并領(lǐng)導(dǎo)一個(gè)以博士生為主體的研究小組，從事視覺理論方面的研究。1977年Marr提出了不同于"積木世界"分析方法的計(jì)算視覺理論一一Marr視覺理論.該理論在20世紀(jì)80年代成為計(jì)算機(jī)視覺研究領(lǐng)域中的一個(gè)十分重要的理論框架。

到了80年代中期.計(jì)算機(jī)視覺獲得了迅速發(fā)展，主動視覺理論框架、基于感知特征群的物體識別理論框架等新概念、新方法、新理論不斷涌現(xiàn)。而到90年代.計(jì)算機(jī)視覺在工業(yè)環(huán)境中得到廣泛應(yīng)用，同時(shí)基于多視幾何的視覺理論得到迅速發(fā)展。

機(jī)器視覺與計(jì)算機(jī)視覺的區(qū)別

不過，張廣軍編著的《機(jī)器視覺》一書曾表示，計(jì)算機(jī)視覺(computervision)和機(jī)器視覺(machinevision)這兩個(gè)術(shù)語是既有區(qū)別又有聯(lián)系的。

他提出，計(jì)算機(jī)視覺是采用圖像處理、模式識別、人工智能技術(shù)相結(jié)合的手段，著重于一幅或多幅圖像的計(jì)算機(jī)分析。圖像可以由單個(gè)或者多個(gè)傳感器獲取，也可以是單個(gè)傳感器在不同時(shí)刻獲取的圖像序列。分析是對目標(biāo)物體的識別，確定目標(biāo)物體的位置和姿態(tài)，對三維景物進(jìn)行符號描述和解釋。在計(jì)算機(jī)視覺研究中，經(jīng)常使用幾何模型、復(fù)雜的知識表達(dá)，采用基于模型的匹配和搜索技術(shù)，搜索的策略常使用自底向上、自頂向下、分層和啟發(fā)式控制策略。

機(jī)器視覺則偏重于計(jì)算機(jī)視覺技術(shù)工程化，能夠自動獲取和分析特定的圖像，以控制相應(yīng)的行為。具體地說，計(jì)算機(jī)視覺為機(jī)器視覺提供圖像和景物分析的理論及算法基礎(chǔ)，機(jī)器視覺為計(jì)算機(jī)視覺的實(shí)現(xiàn)提供傳感器模型、系統(tǒng)構(gòu)造和實(shí)現(xiàn)手段。因此可以認(rèn)為.一個(gè)機(jī)器視覺系統(tǒng)就是一個(gè)能自動獲取一幅或多幅目標(biāo)物體圖像.對所獲取圖像的各種特征量進(jìn)行處理、分析和測量，并對測量結(jié)果做出定性分析和定量解釋，從而得到有關(guān)目標(biāo)物體的某種認(rèn)識并做出相應(yīng)決策的系統(tǒng)。機(jī)器視覺系統(tǒng)的功能包括:物體定位、特征檢測、缺陷判斷、目標(biāo)識別、計(jì)數(shù)和運(yùn)動跟蹤。

機(jī)器視覺的優(yōu)勢和應(yīng)用領(lǐng)域

視覺的最大優(yōu)點(diǎn)是與被觀測的對象無接觸，因此對觀測與被觀測者都不會產(chǎn)生任何損傷，這是其他感覺方式無法比擬的。

同時(shí)，機(jī)器視覺所能檢測的對象十分廣泛，人眼觀察不到的范圍，它也可以觀察。例如，紅外線、微波、超聲波等人類就觀察不到，而機(jī)器視覺則可以利用這方面的敏感器件形成紅外線、微波、超聲波等圖像。因此可以說是擴(kuò)展了人類的視覺范圍。另外人無法長時(shí)間地觀察對象，機(jī)器視覺則不知疲勞，始終如一地觀測，所以機(jī)器視覺可以廣泛地用于長時(shí)間惡劣的工作環(huán)境。

目前，機(jī)器視覺主要應(yīng)用于以下領(lǐng)域：

（1）工業(yè)自動化生產(chǎn)線應(yīng)用。產(chǎn)品檢測、自動流水線生產(chǎn)和裝配、自動焊接、PCB印制板檢查以及各種危險(xiǎn)場合工作的機(jī)器人等。將圖像和視覺技術(shù)用于生產(chǎn)自動化，可以加快生產(chǎn)速度，保證質(zhì)量的一致性，還可以避免人的疲勞、注意力不集中等帶來的誤判。

（2）各類檢驗(yàn)和監(jiān)視應(yīng)用。標(biāo)簽文字標(biāo)記檢查，郵政自動化，計(jì)算機(jī)輔助外科手術(shù).顯微醫(yī)學(xué)操作，石油、煤礦等鉆探中數(shù)據(jù)流自動監(jiān)測和濾波，在紡織、印染業(yè)進(jìn)行自動分色、配色.重要場所門廊自動巡視，自動跟蹤報(bào)警等。

（3）視覺導(dǎo)航應(yīng)用。巡航導(dǎo)彈制導(dǎo)、無人駕駛飛機(jī)飛行、自動行駛車輛、移動機(jī)器人、精確制導(dǎo)及自動巡航捕獲目標(biāo)和確定距離等.既可避免人的參與及由此帶來的危險(xiǎn)，也可提高精度和速度。

（4）圖像自動解釋應(yīng)用。對放射圖像、顯微圖像、醫(yī)學(xué)圖像、遙感多波段圖像、合成孔徑雷達(dá)圖像、航天航測圖像等的自動判讀理解。由于近年來技術(shù)的發(fā)展，圖像的種類和數(shù)量飛速增長，圖像的自動理解已成為解決信息膨脹問題的重要手段。

（5）人機(jī)交互應(yīng)用。人臉識別、智能代理等。同時(shí)讓計(jì)算機(jī)可借助人的手勢動作（手語）嘴唇動作（唇讀）、軀干運(yùn)動（步態(tài)）、表情測定等了解人的愿望要求而執(zhí)行指令，這既符合人類的交豆習(xí)慣，也可增加交互方便性和臨場感等。

（6）虛擬現(xiàn)實(shí)應(yīng)用。飛機(jī)駕駛員圳練、醫(yī)學(xué)手術(shù)模擬、場景建模、戰(zhàn)場環(huán)境表示等，它可幫助人們超越人的生理極限，"親臨其境"，提高工作效率。

監(jiān)控?cái)z像與機(jī)器視覺

作為機(jī)器視覺的代表應(yīng)用，以攝像機(jī)為核心的視頻監(jiān)控系統(tǒng)廣泛應(yīng)用與安保、交通、樓宇、工業(yè)等各個(gè)行業(yè)領(lǐng)域。隨著數(shù)字技術(shù)越來越多地應(yīng)用于視頻監(jiān)控系統(tǒng)中，極大地提高了系統(tǒng)性能，也擴(kuò)大了它的應(yīng)用范圍。但是，監(jiān)控?cái)z像仍局限于一般的人工監(jiān)視和事后錄像分析上，這種做法需要大量的人工輔助，系統(tǒng)缺乏一定的自主判斷能力。

然而，當(dāng)機(jī)器視覺與圖像處理技術(shù)加入之后，打破了原有的限制，得以設(shè)計(jì)出一個(gè)實(shí)時(shí)視頻監(jiān)控系統(tǒng)。該系統(tǒng)在實(shí)現(xiàn)視頻監(jiān)控同時(shí)，通過運(yùn)用機(jī)器視覺技術(shù)，增加了視頻變化檢測和自動錄像功能，系統(tǒng)能夠自動識別場景變化，檢測出運(yùn)動目標(biāo)并鎖定，同時(shí)發(fā)出警告和啟動存儲裝置。這樣不僅可以節(jié)省大量存儲空間，提高監(jiān)控存儲效率，減少不必要的回放，而且數(shù)據(jù)更加具有針對性。

上一篇：AVT相機(jī)之Pike F-1600B/C

下一篇：購買工業(yè)相機(jī)必須了解的參數(shù)

機(jī)器視覺,如何賦予改變未來的想象?

QQ咨詢

掃一掃