你的位置:首頁(yè) > 傳感技術(shù) > 正文

讓現實(shí)世界的情感為人工智能所用(一)

發(fā)布時(shí)間:2019-12-11 來(lái)源:Michael Parks 責任編輯:wenwei

【導讀】過(guò)去數十萬(wàn)年來(lái),人腦一直堪稱(chēng)地球上最強大的計算機。我們的大腦是無(wú)與倫比的進(jìn)化杰作,它不僅具有邏輯和推理能力,更具有創(chuàng )造力和情感。時(shí)至如今,科學(xué)家依然熱衷于人腦的生物學(xué)研究,而工程師則始終致力于采用硅電子和軟件技術(shù)來(lái)復刻人腦的功能。
 
深度學(xué)習(DL)是一種機器學(xué)習(ML)技術(shù)。作為一項新興的人工智能(AI)技術(shù),深度學(xué)習在第二代英特爾NCS(NCS2)中居于核心地位。深度神經(jīng)網(wǎng)絡(luò )依靠ML算法和樣本訓練數據來(lái)生成數學(xué)模型。要生成經(jīng)過(guò)訓練的模型,需要非常大量的計算工作,只有專(zhuān)用于重度計算的硬件才能勝任,但訓練完成后的模型卻可以運行在樹(shù)莓派(Raspberry Pi)、NCS2等相對低成本的硬件上。通過(guò)推測技術(shù),這些模型在遇到新的現實(shí)世界輸入時(shí)便可以迅速作出預測。
 
例如,如果讓一個(gè)視覺(jué)模型處理成千上萬(wàn)的紅色和綠色蘋(píng)果圖片,就可以訓練這個(gè)模型識別這兩種顏色的蘋(píng)果。然后,在NCS2上運行訓練過(guò)的模型,并將通過(guò)網(wǎng)絡(luò )攝像頭獲取的新圖像輸入到模型中,此時(shí)神經(jīng)網(wǎng)絡(luò )便可以對攝像頭視野中的蘋(píng)果進(jìn)行識別和分類(lèi)。
 
物理計算:讓技術(shù)與現實(shí)更息息相關(guān)
 
就在不久前,創(chuàng )建人工大腦的想法還純粹是科幻小說(shuō)中的腦洞。如今,雖然我們距離真正的通用AI還有很長(cháng)的路要走,但技術(shù)正持續以疾速發(fā)展,這是不可否認的。不過(guò),雖然追求技術(shù)成就本質(zhì)上就值得我們?yōu)橹冻?,但我們不能忘了生活中不可或缺的藝術(shù)和創(chuàng )造。物理計算可以在無(wú)形的數字技術(shù)與有形事物的更直觀(guān)本質(zhì)之間建立起一座橋梁,并且項目中的「黑科技」本身就有助于化解公眾接受新技術(shù)的障礙,而人工智能顯然就是一項可以從這種相關(guān)性中受益的創(chuàng )新。
 
在本文所述的項目中,我們將采用尖端的AI驅動(dòng)機器視覺(jué)新技術(shù),并將物理計算為人與技術(shù)間交互帶來(lái)的樂(lè )趣和新奇之處融會(huì )于其中。我們將使用兩個(gè)NCS2、一臺樹(shù)莓派、一臺攝像頭和數個(gè)伺服電機來(lái)構建一臺面部表情識別設備,它可以觀(guān)察一個(gè)人的面部并確定其表情,然后根據特定種類(lèi)的表情在現實(shí)世界中執行某些動(dòng)作。
 
背景
 
如果您從沒(méi)有接觸過(guò)神經(jīng)網(wǎng)絡(luò )或從未使用Python編寫(xiě)過(guò)程序,那么這個(gè)項目就非常適合用來(lái)了解這兩項技能,而且嘗試在一個(gè)項目中集成英特爾第二代神經(jīng)計算棒(NCS2),這本身也是一種不錯的學(xué)習體驗。在此過(guò)程中,當您看到機器學(xué)習、深度學(xué)習、神經(jīng)網(wǎng)絡(luò )等術(shù)語(yǔ)時(shí),與其說(shuō)它們寫(xiě)在數據表或應用筆記里面,更不如說(shuō)它們就好像從科幻小說(shuō)的書(shū)頁(yè)里飛出來(lái)一般。
 
讓現實(shí)世界的情感為人工智能所用(一)
圖1:人工智能是一個(gè)廣泛而深入的研究領(lǐng)域,本項目實(shí)現的是卷積神經(jīng)網(wǎng)絡(luò )(CNN)
 
本項目的核心是NCS2。這是一款USB 3.0設備,嵌入式系統開(kāi)發(fā)人員若要在自己的產(chǎn)品中實(shí)現基于視覺(jué)的智能,便可以通過(guò)這款設備獲得近乎即插即用的AI推理功能。NCS2基于Movidius Myriad X視覺(jué)處理單元(VPU)構建,這是一款針對AI優(yōu)化的芯片,對基于卷積神經(jīng)網(wǎng)絡(luò )(CNN)的視覺(jué)計算可以起到加速作用。使用此技術(shù)可以進(jìn)行對象識別和分類(lèi)(即識別攝像頭視野中是否存在人臉以及這張臉是否在微笑)。
 
如果您對這一切都感到陌生,無(wú)法理解一個(gè)想法如何最終變成一套使用NCS2并借助攝像頭來(lái)識別和分類(lèi)物體,并且還真的能夠運行起來(lái)的系統,那么我們不妨花點(diǎn)時(shí)間來(lái)厘清其中涉及的工作流程。
 
1、訓練神經(jīng)網(wǎng)絡(luò )(NN):神經(jīng)網(wǎng)絡(luò )的訓練可以采用多種機器學(xué)習框架來(lái)進(jìn)行,包括Caffe、TensorFlow、Kaldi、MXNet和開(kāi)放神經(jīng)網(wǎng)絡(luò )交換(ONNX),其中部分框架可以在臺式計算機上運行,還有一些能夠以容器的形式借助AWS或Google Compute Engine等云服務(wù)來(lái)運行。對訓練神經(jīng)網(wǎng)絡(luò )而言,算力(CPU和GPU)是最重要的因素;投入的算力越多,最終得出的模型就越快、越靠譜,因為要讓神經(jīng)網(wǎng)絡(luò )檢測一種物體,就必須要用這種物體的圖片來(lái)訓練它,而且至少需要用到數千張描繪簡(jiǎn)單物體的圖片,因而算法需要處理大量數據,最終導致的結果就是訓練神經(jīng)網(wǎng)絡(luò )需要極高的處理能力。如果使用監督學(xué)習模式進(jìn)行訓練,那么訓練圖像的數據集必須事先進(jìn)行標注,這也極有可能耗費掉訓練人員的大量時(shí)間。
 
2、下載模型:要讓我們的設備檢測出攝像頭拍攝到的物體,模型訓練只是第一步,無(wú)論它執行起來(lái)是多么的費時(shí)。在本文所述的項目中,該模型將檢測人臉,并對人臉所表現的情感進(jìn)行分類(lèi)。英特爾NCS2可以和多種流行的框架一起使用,這些框架包括.caffemodel(Caffe)、.pb(TensorFlow)、.params(MXNet)、.onnx(ONNX)和.nnet(Kaldi)。
 
不過(guò)在這里要告訴大家一個(gè)好消息:一些大神已經(jīng)分享了他們以往訓練并生成的模型,并通過(guò)網(wǎng)絡(luò )提供下載;但就和采用其它預先構建的軟件一樣,由于每個(gè)用戶(hù)的具體情況各不相同,最終的效果便會(huì )因人而異,也許并不一定如預期那樣理想。不過(guò),在許多情況下,直接使用預先訓練好的庫就已經(jīng)足夠。在本文所述的項目中,我們將會(huì )用到人臉檢測模型,并對檢測到的人臉所做出的表情進(jìn)行分類(lèi)。
 
3、為推測硬件準備模型:獲取到經(jīng)過(guò)訓練的模型后,下一步就是通過(guò)一定的準備工作讓它運行在選定的終端設備上。英特爾的OpenVINO工具套件正是為此準備的。該套件提供的模型優(yōu)化器(Model Optimizer)可讀取Caffe、TensorFlow等神經(jīng)網(wǎng)絡(luò )框架產(chǎn)生的數據,然后輸出中間表示(Intermediate Representation, IR)數據,其中包含一個(gè).xml文件和一個(gè).bin文件,前者包含了描述神經(jīng)網(wǎng)絡(luò )拓撲結構的代碼,后者包含了二進(jìn)制的權值和閾值數據;換言之,.xml文件描述了神經(jīng)網(wǎng)絡(luò )內部如何互聯(lián),.bin文件則表明了分配給每條路徑的值(權重)。
 
4、推測:目前為止,我們還沒(méi)有用上英特爾NCS2。正如前面說(shuō)的那樣,訓練模型需要由非?!父叽笊稀沟挠嬎阌布?lái)做。至于「推測」,說(shuō)白了就是把新的輸入內容交給神經(jīng)網(wǎng)絡(luò )來(lái)辨識、分類(lèi)和處理,這就是NCS2發(fā)揮作用的地方了。OpenVINO將會(huì )讀取IR內容,對神經(jīng)網(wǎng)絡(luò )執行準備工作,然后將之加載到選定的終端設備(本例中為NCS2)上,并設置所需的配置參數。隨后,NCS2上搭載的推理引擎(Inference Engine, IE)將執行該深度學(xué)習模型,并在提供輸入數據時(shí)對其進(jìn)行推測。它還提供了一組便于使用的庫,以便將IE的輸出集成到定制的應用程序中。
 
5、使用API開(kāi)發(fā)增值功能:數十年來(lái),嵌入式系統的固件開(kāi)發(fā)一直由C編程語(yǔ)言主導,但近年來(lái)Python在應用程序開(kāi)發(fā)方面越來(lái)越受到關(guān)注。隨著(zhù)MicroPython和CircuitPython分支的創(chuàng )建,Python也開(kāi)始涉足嵌入式開(kāi)發(fā)領(lǐng)域。在本文所述的項目中,我們將采用英特爾的Python API與推理引擎進(jìn)行交互。對于希望繼續使用C/C++的人士,英特爾還提供了一個(gè)C++庫。借助這套Python API,與推理引擎的交互問(wèn)題便可轉化為簡(jiǎn)潔的函數調用。
 
物料
 
本項目將使用4GB版本的樹(shù)莓派4單板機作為系統核心,此外還包括以下關(guān)鍵組件:
 
讓現實(shí)世界的情感為人工智能所用(一)
圖2:樹(shù)莓派4依舊保持了小巧的尺寸,但硬件進(jìn)行了大幅度升級
 
1、兩個(gè)英特爾NCS2
2、一個(gè)OV5647攝像頭(也可采用USB攝像頭)
3、三個(gè)伺服電機
 
物料清單(BOM)
 
本項目的物料清單如表1所示?;蛘?,您可以單擊此處訪(fǎng)問(wèn)mouser.com加載預定義的購物車(chē),一次性買(mǎi)齊這些部件。本文撰寫(xiě)時(shí),以下物料清單不含運費和稅費的總價(jià)約為370美元。
 
表1:AI+物理計算項目物料清單
讓現實(shí)世界的情感為人工智能所用(一)
 
工具和其他資源
 
以下所列是完成本項目推薦使用的工具:
 
●  基于Windows,運行OpenVINO工具套件的計算機
●  帶有HDMI端口的電腦顯示器或電視機
●  無(wú)線(xiàn)或有線(xiàn)Internet連接
●  USB 3.0集線(xiàn)器
●  USB鍵盤(pán)
●  USB鼠標
●  USB攝像頭(可選項,不使用OV5647攝像頭時(shí)需要使用)
●  剝線(xiàn)鉗
●  數字萬(wàn)用表
●  尖嘴鉗
 
系統概覽
 
讓現實(shí)世界的情感為人工智能所用(一)
圖3:構思想法時(shí),隨筆畫(huà)是一種不錯的做法
 
該系統由五個(gè)主要部件構成:
 
1、樹(shù)莓派:新款樹(shù)莓派可謂單板機(SBC)中的實(shí)力派,它搭載了一顆主頻1.5GHz的Broadcom BCM2711四核Cortex-A72 64位SoC,這里我們采用的是帶4GB LPDDR4-2400 SDRAM的型號。該產(chǎn)品采用已成為現行標準的40引腳GPIO接頭與伺服電機進(jìn)行交互。同時(shí),樹(shù)莓派還將用于運行Python腳本、攝像頭和HDMI監視器的主機,并與兩個(gè)NCS2設備配合工作。
 
2、神經(jīng)計算棒:NCS2設備上將運行兩個(gè)神經(jīng)網(wǎng)絡(luò ),其中一個(gè)神經(jīng)網(wǎng)絡(luò )負責對攝像頭獲取的視頻流進(jìn)行分析,檢測視頻幀中是否出現人臉;另一個(gè)神經(jīng)網(wǎng)絡(luò )則負責推測這個(gè)人的臉上流露出怎樣的表情。
 
3、攝像頭:攝像頭會(huì )將圖像流輸入到NCS設備進(jìn)行分析。本項目中可以使用USB攝像頭,也可以使用Raspberry Pi OV5647攝像頭。運行Python腳本時(shí),可以借助一個(gè)命令行標志來(lái)設置使用的攝像頭。
 
4、伺服電機:三個(gè)伺服器將與機械滑塊一同使用,以便與現實(shí)世界互動(dòng)。具體而言,本項目將根據用戶(hù)對攝像頭呈現的表情向用戶(hù)展示不同顏色的花朵:黃色表示快樂(lè ),藍色表示悲傷,紅色則表示憤怒。
 
5、HDMI監視器:HDMI監視器將用于向用戶(hù)顯示終端和攝像頭的輸出內容。
 
構建電子元件
 
讓現實(shí)世界的情感為人工智能所用(一)
圖4:硬件之間的連接非常簡(jiǎn)單明了
 
本項目組裝非常簡(jiǎn)單明了,唯一需要提出的建議是等到樹(shù)莓派完全啟動(dòng)后再將NCS2插入USB中;如果在初次啟動(dòng)前插入NCS2,樹(shù)莓派可能會(huì )無(wú)法啟動(dòng),雖然我們并不清楚問(wèn)題是不是出在這里。后續的啟動(dòng)沒(méi)有問(wèn)題,并且也不會(huì )再重現該問(wèn)題。
 
1、將micro-HDMI轉HDMI適配器插入樹(shù)莓派。
 
2、將HDMI數據線(xiàn)插入電腦顯示器或電視機的HDMI端口。
 
3、將刷入最新版Raspbian的MicroSD存儲卡插入到樹(shù)莓派。有關(guān)如何將Raspbian操作系統安裝到MicroSD存儲卡上的說(shuō)明,請單擊此處。
 
4、將USB鍵盤(pán)和鼠標插入USB 2.0端口,也就是帶黑色塑料連接器的USB端口,而不是帶藍色塑料連接器的USB 3.0端口。
 
5、安裝攝像頭。
 
(1) 如果使用OV5647攝像機,請輕輕打開(kāi)連接器,插入排線(xiàn),然后合上連接器。
 
(2) 如果使用USB攝像頭,請將其插入樹(shù)莓派的USB 3.0端口。
 
6、將USB-C電源的一端插入交流電源插座。
 
7、將USB-C電源的另一端插入樹(shù)莓派的USB電源插孔。
 
8、啟動(dòng)樹(shù)莓派并完成初始設置,然后關(guān)閉樹(shù)莓派。初始設置步驟至此完成。
 
讓現實(shí)世界的情感為人工智能所用(一)
圖5:樹(shù)莓派的PIO接頭引腳分布
 
完成初始設置后,下一步就是安裝伺服電機。我們將在樹(shù)莓派上安裝三個(gè)伺服電機。
 
9、使用連接線(xiàn)將樹(shù)莓派的GND引腳連接到迷你試驗板的GND(藍色)電極。
 
10、使用連接線(xiàn)將樹(shù)莓派的5V引腳連接到迷你試驗板的電源(紅色)電極。
 
11、將每個(gè)伺服電機的GND電纜連接到試驗板的GND電極。
 
12、將每個(gè)伺服電機的Vcc電纜連接到試驗板的電源電極。
 
13、將第一個(gè)伺服電機的控制信號連接到樹(shù)莓派的GPIO12引腳。此為「快樂(lè )」伺服電機。
 
14、將第一個(gè)伺服電機的控制信號連接到樹(shù)莓派的GPIO13引腳。此為「悲傷」伺服電機。
 
15、將第一個(gè)伺服電機的控制信號連接到樹(shù)莓派的GPIO18引腳。此為「憤怒」伺服電機。
 
現在,伺服電機接線(xiàn)完成,接下來(lái)要進(jìn)行最后的組裝步驟,就是實(shí)現與兩個(gè)NCS設備共同工作。
 
1、將兩個(gè)英特爾神經(jīng)計算棒插入USB 3.0集線(xiàn)器。暫時(shí)先不要把集線(xiàn)器插入到樹(shù)莓派。
 
2、再次啟動(dòng)樹(shù)莓派并登錄。
 
3、安裝運行NCS設備所需的軟件(參見(jiàn)本文的“軟件”一節),然后再次重新啟動(dòng)樹(shù)莓派??吹街甘竞?,將USB 3.0集線(xiàn)器插入樹(shù)莓派的USB 3.0端口。
 
出處:貿澤電子公眾號
微信號:mouserelectronics
要采購工具么,點(diǎn)這里了解一下價(jià)格!
特別推薦
技術(shù)文章更多>>
技術(shù)白皮書(shū)下載更多>>
熱門(mén)搜索
?

關(guān)閉

?

關(guān)閉

久久无码人妻精品一区二区三区_精品少妇人妻av无码中文字幕_98精品国产高清在线看入口_92精品国产自产在线观看481页