“得益于大語言模型推動人工智能發展,圖形圖像學的研究和應用迎來新的機遇,正在推動大語言模型向大視覺模型發展。”2023年12月30日,在辭舊迎新之際,中國工程院院士、機器人視覺感知與控制技術國家工程研究中心主任王耀南在第十九屆中國圖象圖形學學會青年科學家會議上,分享機器視覺智能化發展的新趨勢。
在接受南都記者專訪時,王耀南表示,人工智能讓機器視覺走向智能化,更高的算力能夠支撐大視覺模型的訓練。不過,更聰明的大視覺模型還需要更高的算力水平、更好的模型架構和更有效的學習算法。
本次會議由中國圖象圖形學學會主辦,琶洲實驗室、華南理工大學、中山大學、中國圖象圖形學學會青年工作委員會承辦。
談行業趨勢
從視覺計算走向視覺智能
王耀南:我國的機器視覺研究已有接近40年的歷史,初是從傳感器的研究開始的,即:將光的信息轉化成圖片信息。接下來要做的是視覺的處理,包括將獲得的圖片增強,使其變得更清晰。
有了清晰的圖像后,我們需要從圖片中獲取我們感興趣的目標。例如,在無人駕駛領域,機器視覺需要對圖片中的目標進行檢測,要回答哪些是人、哪些是車的問題。
這就是我們所說的機器視覺的三大領域。我把它歸結為:成像、處理和理解。
機器視覺已經從過去的視覺計算走向了的視覺智能。視覺計算結合人工智能后,認知水平得到了提升,增強了對復雜環境的理解能力,整個視覺智能化行業在去年得到了快速發展。
機器視覺智能化發展的方向是進行廣泛應用,應用到工業檢測、智能制造以及衛星遙感等領域。
談機器視覺,一定要談它的應用,應用驅動技術發展。中國圖象圖形學學會有30個專委會,主要圍繞圖形圖像展開研究,為國民經濟服務。這些技術的應用場景十分廣泛,包括工業、農業、地理信息系統、遙感、國土資源等。
一個人一出生就能看到這個世界,之后理解這個世界,80%的信息靠視覺獲取。機器視覺是要模擬人的眼睛,終達到人眼的水平,并在部分方面超過人眼,要看得更遠、看得更清。
談大視覺模型
大視覺模型會越來越聰明
王耀南:大語言模型是用書本上、語言上、文字上的知識作為數據,進行訓練的神經網絡模型,能夠根據它所學的知識進行推理和回答,是一種數據驅動的人工智能。
大視覺模型的數據則主要來自各種圖像,包括人類和自然界產生的視覺數據。例如,醫學大視覺模型就是將人的器官、病變的圖像等作為視覺數據輸入到大模型中,進行訓練得到,可以像大夫一樣看懂CT照片,能夠達到病人來看病后,拍照完便能推理出病人病情的效果。
當前的視覺大模型并沒有大家想象的和人腦一樣,差距還很大。隨著學習的數據的增多、模型參數的調整,模型會越來越大、知識也會越來越多,其智能水平就會越來越高,越來越聰明。
我們需要提高算力水平,加快計算速度,以能夠更快地建立模型;設計更好的模型架構,包括可解釋性更強、更安全可控;還需要研究更有效的學習算法。
事實上,視覺大模型并不是這幾年才有的,是一步一步發展過來的。在上世紀80年代,隨著人工智能的發展,人們開始研究神經網絡的時候,就已經有了。只是,近幾年的算力和算法能力提高了,人們可以嘗試構建大模型,產生了大語言模型和大視覺模型。過去算力不夠的時候,大家做的模型沒有那么大。
談2024年展望
希望業務從廣州增長推向全國和世界
王耀南:湖南大學機器人視覺感知與控制技術國家工程研究中心在2022年已經入駐到位于粵港澳大灣區的廣州增城,建立了湖大粵港澳大灣區創新研究院(廣州增城)。
研究院主要進行機器智能視覺的研究和應用,包括智能制造、醫療制藥等領域的特殊作業機器人,以及通用的大視覺模型。例如,這些研究運用到制造業中,可以替代大量的人工,完成產品質量的檢測,特別是3C和高端零部件行業。當前,研究院已經開發了軟硬件系統,主要的功能是賦能廣東企業數字化、智慧化轉型,推動制造業發展。
此外,研究院也開展智能的機器視覺和控制系統,主要用于高端智能裝備的生產,例如工業互聯網軟件,這其中有非常多的算法。
廣東是改革開放和經濟主戰場的前沿,產業鏈、供應鏈齊全,制造業企業很多,我們來到廣東布局一是出于市場需求。此外,我們研究中心此前已有不少研發團隊在廣東落地了很多項目,進行科技成果的轉化。
在2023年的上半年,我們確實遇到了一些挑戰,主要體現在零部件的供應方面。2024年,我相信這些問題都會解決,廣東人工智能產業的產業鏈、供應鏈以及研發能力都會有所提升。在國內這個大市場里,會開辟出新的賽道。在活力的氛圍下,大家主動作為、擔當和創新,挑戰都能解決。
我對廣東的人工智能產業發展充滿信心。過去30年里,我們在科技自立自強方面下了很多功夫,積累了很多科研成果。廣東是我國經濟大省。
我們所從事的人工智能與機器人這個領域趕上了一個好機遇,這兩年爆炸性地增長,帶來很多新市場,拉動了新的產業賽道。未來智能終端將越來越多,也將帶動生產型設施設備行業的發展。在2024年,我希望我們位于廣州增城的研究院能夠將業務推向全國和世界。
- 工信部:5項工業互聯網平臺國家標準正式發布實施 2024-12-27
- 艾利丹尼森數字化解決方案亮相微軟技術中心 沉浸式體驗賦能客戶數字化轉型 2024-12-27
- 皮爾磁:安全抓取,高效無憂 2024-12-27
- 機器人+教育,一場科技與教育的雙向奔赴 2024-12-27
- 深度解密!PROFIBUSshida常見錯誤有哪些? 2024-12-27
- 專業鑄就品質!越疆機器人入駐歐洲Zui大臨床實驗室Labor Berlin 2024-12-27
- 英威騰發布新品TS635 解鎖貼膠“黑科技” 2024-12-27
- 中國電科第一代人形機器人對外發布,預計2024年投入應用 2024-12-27
- 中控Ethernet-APL系列交換機通過ATEX和IECEx國際防爆認證 2024-12-27
- 創新加持,守護健康 ——魏德米勒遠程I/O在無菌制藥設備中的應用 2024-12-27
- 港迪技術IPO進程繼續推進,深耕工業自動化領域 2024-12-27
- 中控技術發布業績預告:預計2023營收同比增長20.17%到40.10% 2024-12-27
- 趕快排查!市場上竟然有假的ITC紅外培訓證書...... 2024-12-27
- 智能樓宇系統canopen協議與ModbusTCP協議進行通訊 2024-12-27
- 關于征集智能制造領域國家標準起草單位的通知 2024-12-27
聯系方式
- 電 話:0592-6372630
- 銷售經理:蘭順長
- 手 機:18030129916
- 微 信:18030129916