機(jī)器視覺,如何賦予改變未來的想象?
發(fā)布時(shí)間:2023-04-28 | 信息來源:上海硯拓自動化科技有限公司 | 點(diǎn)擊量:853
隨著信息技術(shù)的發(fā)展,給計(jì)算機(jī)、機(jī)器人或其他智能機(jī)器賦予人類視覺功能,成為人類多年以來的夢想。
視覺是人類觀察世界和認(rèn)知世界的重要手段。據(jù)統(tǒng)計(jì),人類從外部世界獲得的信息約有80%是由提覺獲取的。這既說明視覺信息量巨大,也表明人類對視覺信息有較高的利用率,同時(shí)又體現(xiàn)了人類視覺功能的重要性。隨著信息技術(shù)的發(fā)展,給計(jì)算機(jī)、機(jī)器人或其他智能機(jī)器賦予人類視覺功能,成為人類多年以來的夢想。
目前許多機(jī)器視覺技術(shù)已經(jīng)實(shí)現(xiàn)了產(chǎn)品化、實(shí)用化。例如,指紋識別、車牌照識別、智能監(jiān)控、人臉識別、工業(yè)產(chǎn)品的在線檢測等。可以說,機(jī)器視覺技術(shù)在信息化時(shí)代,扮演著越來越重要的角色。
什么是機(jī)器視覺?
機(jī)器視覺(machinevision)又常被稱作為計(jì)算機(jī)視覺(computervision),是用計(jì)算機(jī)實(shí)現(xiàn)人的視覺功能一一對客觀世界的三維場景的感知、識別和理解。
自20世紀(jì)50年代從統(tǒng)計(jì)模式識別開始的,計(jì)算機(jī)視覺當(dāng)時(shí)的工作主要集中在二維圖像分析、識別和理解上,如光學(xué)字符識別、工件表面、顯微圖片和航空照片的分析和解釋等。1973年,英國的Marr教授應(yīng)邀在麻省理工學(xué)院(MIT)的人工智能實(shí)驗(yàn)室創(chuàng)建并領(lǐng)導(dǎo)一個(gè)以博士生為主體的研究小組,從事視覺理論方面的研究。1977年Marr提出了不同于"積木世界"分析方法的計(jì)算視覺理論一一Marr視覺理論.該理論在20世紀(jì)80年代成為計(jì)算機(jī)視覺研究領(lǐng)域中的一個(gè)十分重要的理論框架。
到了80年代中期.計(jì)算機(jī)視覺獲得了迅速發(fā)展,主動視覺理論框架、基于感知特征群的物體識別理論框架等新概念、新方法、新理論不斷涌現(xiàn)。而到90年代.計(jì)算機(jī)視覺在工業(yè)環(huán)境中得到廣泛應(yīng)用,同時(shí)基于多視幾何的視覺理論得到迅速發(fā)展。
機(jī)器視覺與計(jì)算機(jī)視覺的區(qū)別
不過,張廣軍編著的《機(jī)器視覺》一書曾表示,計(jì)算機(jī)視覺(computervision)和機(jī)器視覺(machinevision)這兩個(gè)術(shù)語是既有區(qū)別又有聯(lián)系的。
他提出,計(jì)算機(jī)視覺是采用圖像處理、模式識別、人工智能技術(shù)相結(jié)合的手段,著重于一幅或多幅圖像的計(jì)算機(jī)分析。圖像可以由單個(gè)或者多個(gè)傳感器獲取,也可以是單個(gè)傳感器在不同時(shí)刻獲取的圖像序列。分析是對目標(biāo)物體的識別,確定目標(biāo)物體的位置和姿態(tài),對三維景物進(jìn)行符號描述和解釋。在計(jì)算機(jī)視覺研究中,經(jīng)常使用幾何模型、復(fù)雜的知識表達(dá),采用基于模型的匹配和搜索技術(shù),搜索的策略常使用自底向上、自頂向下、分層和啟發(fā)式控制策略。
機(jī)器視覺則偏重于計(jì)算機(jī)視覺技術(shù)工程化,能夠自動獲取和分析特定的圖像,以控制相應(yīng)的行為。具體地說,計(jì)算機(jī)視覺為機(jī)器視覺提供圖像和景物分析的理論及算法基礎(chǔ),機(jī)器視覺為計(jì)算機(jī)視覺的實(shí)現(xiàn)提供傳感器模型、系統(tǒng)構(gòu)造和實(shí)現(xiàn)手段。因此可以認(rèn)為.一個(gè)機(jī)器視覺系統(tǒng)就是一個(gè)能自動獲取一幅或多幅目標(biāo)物體圖像.對所獲取圖像的各種特征量進(jìn)行處理、分析和測量,并對測量結(jié)果做出定性分析和定量解釋,從而得到有關(guān)目標(biāo)物體的某種認(rèn)識并做出相應(yīng)決策的系統(tǒng)。機(jī)器視覺系統(tǒng)的功能包括:物體定位、特征檢測、缺陷判斷、目標(biāo)識別、計(jì)數(shù)和運(yùn)動跟蹤。
機(jī)器視覺的優(yōu)勢和應(yīng)用領(lǐng)域
視覺的最大優(yōu)點(diǎn)是與被觀測的對象無接觸,因此對觀測與被觀測者都不會產(chǎn)生任何損傷,這是其他感覺方式無法比擬的。
同時(shí),機(jī)器視覺所能檢測的對象十分廣泛,人眼觀察不到的范圍,它也可以觀察。例如,紅外線、微波、超聲波等人類就觀察不到,而機(jī)器視覺則可以利用這方面的敏感器件形成紅外線、微波、超聲波等圖像。因此可以說是擴(kuò)展了人類的視覺范圍。另外人無法長時(shí)間地觀察對象,機(jī)器視覺則不知疲勞,始終如一地觀測,所以機(jī)器視覺可以廣泛地用于長時(shí)間惡劣的工作環(huán)境。
目前,機(jī)器視覺主要應(yīng)用于以下領(lǐng)域:
(1)工業(yè)自動化生產(chǎn)線應(yīng)用。產(chǎn)品檢測、自動流水線生產(chǎn)和裝配、自動焊接、PCB印制板檢查以及各種危險(xiǎn)場合工作的機(jī)器人等。將圖像和視覺技術(shù)用于生產(chǎn)自動化,可以加快生產(chǎn)速度,保證質(zhì)量的一致性,還可以避免人的疲勞、注意力不集中等帶來的誤判。
(2)各類檢驗(yàn)和監(jiān)視應(yīng)用。標(biāo)簽文字標(biāo)記檢查,郵政自動化,計(jì)算機(jī)輔助外科手術(shù).顯微醫(yī)學(xué)操作,石油、煤礦等鉆探中數(shù)據(jù)流自動監(jiān)測和濾波,在紡織、印染業(yè)進(jìn)行自動分色、配色.重要場所門廊自動巡視,自動跟蹤報(bào)警等。
(3)視覺導(dǎo)航應(yīng)用。巡航導(dǎo)彈制導(dǎo)、無人駕駛飛機(jī)飛行、自動行駛車輛、移動機(jī)器人、精確制導(dǎo)及自動巡航捕獲目標(biāo)和確定距離等.既可避免人的參與及由此帶來的危險(xiǎn),也可提高精度和速度。
(4)圖像自動解釋應(yīng)用。對放射圖像、顯微圖像、醫(yī)學(xué)圖像、遙感多波段圖像、合成孔徑雷達(dá)圖像、航天航測圖像等的自動判讀理解。由于近年來技術(shù)的發(fā)展,圖像的種類和數(shù)量飛速增長,圖像的自動理解已成為解決信息膨脹問題的重要手段。
(5)人機(jī)交互應(yīng)用。人臉識別、智能代理等。同時(shí)讓計(jì)算機(jī)可借助人的手勢動作(手語)嘴唇動作(唇讀)、軀干運(yùn)動(步態(tài))、表情測定等了解人的愿望要求而執(zhí)行指令,這既符合人類的交豆習(xí)慣,也可增加交互方便性和臨場感等。
(6)虛擬現(xiàn)實(shí)應(yīng)用。飛機(jī)駕駛員圳練、醫(yī)學(xué)手術(shù)模擬、場景建模、戰(zhàn)場環(huán)境表示等,它可幫助人們超越人的生理極限,"親臨其境",提高工作效率。
監(jiān)控?cái)z像與機(jī)器視覺
作為機(jī)器視覺的代表應(yīng)用,以攝像機(jī)為核心的視頻監(jiān)控系統(tǒng)廣泛應(yīng)用與安保、交通、樓宇、工業(yè)等各個(gè)行業(yè)領(lǐng)域。隨著數(shù)字技術(shù)越來越多地應(yīng)用于視頻監(jiān)控系統(tǒng)中,極大地提高了系統(tǒng)性能,也擴(kuò)大了它的應(yīng)用范圍。但是,監(jiān)控?cái)z像仍局限于一般的人工監(jiān)視和事后錄像分析上,這種做法需要大量的人工輔助,系統(tǒng)缺乏一定的自主判斷能力。
然而,當(dāng)機(jī)器視覺與圖像處理技術(shù)加入之后,打破了原有的限制,得以設(shè)計(jì)出一個(gè)實(shí)時(shí)視頻監(jiān)控系統(tǒng)。該系統(tǒng)在實(shí)現(xiàn)視頻監(jiān)控同時(shí),通過運(yùn)用機(jī)器視覺技術(shù),增加了視頻變化檢測和自動錄像功能,系統(tǒng)能夠自動識別場景變化,檢測出運(yùn)動目標(biāo)并鎖定,同時(shí)發(fā)出警告和啟動存儲裝置。這樣不僅可以節(jié)省大量存儲空間,提高監(jiān)控存儲效率,減少不必要的回放,而且數(shù)據(jù)更加具有針對性。
硯拓主要代理AVT相機(jī)|AVT紅外相機(jī)|萬兆網(wǎng)相機(jī)EVT|VIEWORKS線掃相|映美精相機(jī)|Specim多光譜相機(jī)|Adimec相機(jī)|Basler相機(jī)|富士能FUJINON鏡頭|理光RICOH鏡頭|OPTO遠(yuǎn)心鏡頭|SPO遠(yuǎn)心鏡頭|Navtar鏡頭|VST鏡頭|CCS光源|3D視覺引導(dǎo)機(jī)床上下料系統(tǒng)等,歡迎大家來電咨詢。
