【導讀】在更快的連接速度、更高的自動(dòng)化程度和更智能系統的推動(dòng)下,工業(yè)4.0加快了視覺(jué)技術(shù)在制造業(yè)中的應用,并將智能化引入到以往簡(jiǎn)單的數據采集系統中。上一代視覺(jué)系統負責捕捉圖像,對其進(jìn)行封裝以供傳輸,并為后續的FPGA、ASIC或昂貴的SoC等器件提供圖像數據進(jìn)行處理。如今,工業(yè)5.0更進(jìn)一步,通過(guò)在整個(gè)數據通路中融入人工智能(AI)與機器學(xué)習(ML),實(shí)現大規模定制化。攝像頭變得智能化,具備在應用層面處理的圖像數據,僅輸出用于決策的元數據。
在更快的連接速度、更高的自動(dòng)化程度和更智能系統的推動(dòng)下,工業(yè)4.0加快了視覺(jué)技術(shù)在制造業(yè)中的應用,并將智能化引入到以往簡(jiǎn)單的數據采集系統中。上一代視覺(jué)系統負責捕捉圖像,對其進(jìn)行封裝以供傳輸,并為后續的FPGA、ASIC或昂貴的SoC等器件提供圖像數據進(jìn)行處理。如今,工業(yè)5.0更進(jìn)一步,通過(guò)在整個(gè)數據通路中融入人工智能(AI)與機器學(xué)習(ML),實(shí)現大規模定制化。攝像頭變得智能化,具備在應用層面處理的圖像數據,僅輸出用于決策的元數據。
這兩代之間的關(guān)鍵發(fā)展是關(guān)注邊緣端發(fā)生的變化。我們世界本質(zhì)上以模擬為主,許多幫助我們日常生活的電子與機電(EEM)系統都是由各類(lèi)感知輸入驅動(dòng)的。視覺(jué)(光)、溫度(熱)、音頻(聲)、距離與位置、壓力(觸覺(jué))等系統邊緣端的電子傳感器采集這些物理輸入,并將其轉化為處理后的數據,以實(shí)現智能化并方便決策制定。工業(yè)4.0提出了對這類(lèi)傳感器智能和高效的需求。如今,非工業(yè)及商業(yè)應用領(lǐng)域的眾多傳感器不斷發(fā)展,從基礎類(lèi)型發(fā)展到符合工業(yè)自動(dòng)化流程和標準的增強版本。
在大規模采用傳感器的同時(shí),人們也在推動(dòng)更低功耗的電池驅動(dòng)智能設備廣泛應用。功耗給視覺(jué)系統帶來(lái)了不同的挑戰,而圖像傳感器如何以創(chuàng )新的方法解決這些挑戰,同時(shí)提供卓越的性能,將成為視覺(jué)系統的差異化因素。
圖像傳感器--視覺(jué)感知的輸入機制
視覺(jué)感知已成為在邊緣端采集數據的重要方式之一,收集到的圖像數據能夠被快速且高效地用于決策制定。例如,若無(wú)視覺(jué)傳感器,場(chǎng)景中的物體需要無(wú)數個(gè)特定的傳感器來(lái)傳達場(chǎng)景的構成。這會(huì )產(chǎn)生大量數據并需要龐大的處理工作,或許還得靠好運氣,才能得到場(chǎng)景的真實(shí)呈現。另外,在高效的系統中,一張圖像就可以在一幀數據中傳達場(chǎng)景中的所有信息。
這種簡(jiǎn)便的數據表現形式使圖像傳感器得以加速發(fā)展,為智能手機等消費類(lèi)移動(dòng)產(chǎn)品提供支持,其分辨率超過(guò)一億像素,在硬件和軟件的支持下,為靜態(tài)圖像和視頻流提供卓越的細節特征。由于移動(dòng)產(chǎn)品主要服務(wù)于娛樂(lè )和個(gè)人應用,因此其制定決策的目標略有不同。然而,面向汽車(chē)、工業(yè)和商業(yè)應用的視覺(jué)系統服務(wù)于高度以目標為導向的需求,其中許多系統使用(傳感器)輸出進(jìn)行基于機器的決策,并要求在分辨率、幀率和功耗之間達到精細平衡。
隨著(zhù)邊緣智能的重要性日益增強,這些應用必須適應不同用例需求?,F在,許多應用都需要更高的分辨率和更出色的整體性能,以輔助計算機視覺(jué)、機器視覺(jué)和自動(dòng)化決的策系統。很多情況下,人們非??释@得更豐富的細節,因為這些細節有助于減少錯誤決策。隨著(zhù)分辨率的提高,圖像傳感器中的像素數量也會(huì )增加,相應地,傳感器向圖像信號處理器(ISP)或系統芯片(SoC)提供的圖像數據量也會(huì )增加。傳感器產(chǎn)生的大量圖像數據以及ISP/SoC對這些數據的處理會(huì )導致高功耗,從而給視覺(jué)系統設計帶來(lái)巨大負擔。
圖1 圖像傳感器產(chǎn)生的數據隨分辨率和幀速率成指數增長(cháng)
現在,設計人員需要應對高功率電子元件帶來(lái)的高功率傳輸、功耗和系統物料清單(BOM)成本等問(wèn)題。雖然降低功耗是大勢所趨,但熱管理也是一個(gè)挑戰,因為大多數視覺(jué)系統都依賴(lài)對流氣流來(lái)散發(fā)系統中產(chǎn)生的熱量。圖像傳感器對熱量高度敏感,如果不能選擇適當的設計并有效管理上述因素,就會(huì )產(chǎn)生不可靠的視覺(jué)系統。
一切始于量子效率
圖像傳感器的量子效率(QE)是指光電二極管最大限度地將入射光子轉換成電子的能力。眾所周知,QE 越高,圖像亮度越好。更高的 QE 值在弱光條件下非常重要,這通常通過(guò)使用更大的像素尺寸或在場(chǎng)景中添加可見(jiàn)光或不可見(jiàn)光來(lái)實(shí)現。無(wú)論哪種方法,都會(huì )增加視覺(jué)系統必須支持的成本、功耗和空間,并可能會(huì )根據圖像傳感器的性能和場(chǎng)景條件呈指數級增長(cháng)。
圖2 不同波長(cháng)下可比較像素尺寸的歸一化量子效率曲線(xiàn)
這在通常使用紅外發(fā)光二極管(IR LED)的不可見(jiàn)照明情況下尤其嚴重,其產(chǎn)生的光波長(cháng)為850nm和940nm。這些波長(cháng)能被圖像傳感器探測到,但人眼無(wú)法察覺(jué)。在行業(yè)中,這通常被稱(chēng)為 "主動(dòng)照明"。 紅外發(fā)光二極管需要供電并產(chǎn)生功耗,占用大量空間,并顯著(zhù)增加系統 BOM成本。在近紅外光譜中具有高量子效率的圖像傳感器能夠在不犧牲圖像質(zhì)量的前提下,減少其使用數量、降低光照強度以及總體BOM成本。
圖像質(zhì)量更高,總體擁有成本更低
重要的是要確保圖像傳感器像素提供的高 QE 不會(huì )受到數據通路其他部分噪聲的影響,從而影響整體圖像質(zhì)量。例如,如果像素結構沒(méi)有足夠的像素間隔,像素間串擾就會(huì )降低調制傳遞函數(MTF)和對圖像的對比度/清晰度,最終影響圖像質(zhì)量。另一個(gè)可能造成損害的因素是讀出電路性能不佳導致的高讀取噪聲。
圖像質(zhì)量不佳會(huì )給ISP/SoC帶來(lái)不必要的負擔,使其需要處理更多的數據,從而降低視覺(jué)系統的整體幀率,或者以更高的時(shí)鐘頻率運行來(lái)維持相同的端到端時(shí)序。在前一種情況下,視覺(jué)系統的效率會(huì )大大降低,而無(wú)論哪種情況,系統最終都會(huì )產(chǎn)生更多的功耗。為了應對處理負擔,可能需要配備更先進(jìn)資源的ISP/SoC,這將進(jìn)一步增加總體BOM成本。而優(yōu)秀的圖像輸出質(zhì)量能夠緩解上述種種不足,降低視覺(jué)系統的總體擁有成本。
子采樣模式
安森美(onsemi)公司的圖像傳感器(例如HyperluxTM LP產(chǎn)品系列)已經(jīng)意識到這些操作需求,并集成了多種子采樣模式。這些模式,如合并(Binning)、裁剪(Cropping)和跳采(Skipping),能夠大大減少生成和傳輸所需的帶寬。
安森美Hyperlux LP系列產(chǎn)品
這些功能使視覺(jué)系統變得非常智能,能夠根據用例需求選擇最優(yōu)的功耗/性能配置。例如,在生物識別掃描儀中,現在可以利用配備500萬(wàn)像素傳感器陣列的單個(gè)系統,以逐漸增強的掃描方式,完成子采樣模式下的單個(gè)指紋掃描到全分辨率面部掃描。最重要的是,ISP/SoC接收到的數據量減少,從而降低了其自身及整個(gè)視覺(jué)系統的功耗。
縮減數據規模
高分辨率圖像傳感器會(huì )占用大量帶寬來(lái)輸出數據。例如,以60幀/秒速度工作的2000萬(wàn)像素傳感器將傳輸12 Gbps圖像數據,這些數據不僅需要在傳感器內部的高速接口中妥善處理,還需要由接收這些數據的ISP/SoC進(jìn)行處理。處理如此龐大的數據需要在這些處理引擎中投入昂貴且專(zhuān)用的資源和電力,并可能導致大量的功耗/熱管理問(wèn)題。此外,接口速度的限制也增加了這一挑戰。
在大多數應用中,可能只有小部分時(shí)間需要在全分辨率下全速運行,其余時(shí)間則僅需較低分辨率。雖然子采樣模式可以降低帶寬并有其自身優(yōu)勢,但在分辨率選擇或場(chǎng)景完整性方面會(huì )受到一定的限制。
傳感器內的縮放器有助于克服這些限制,有效滿(mǎn)足低分辨率操作的需求。它們能夠在源頭控制帶寬,而不是由 ISP/SoC 管理。它們能夠在最大程度上提供精細的粒度控制,同時(shí)保持完整的視場(chǎng)角(FOV)。安森美 AR2020 圖像傳感器(Hyperlux LP 產(chǎn)品系列的 2000萬(wàn)像素成員)的圖像縮放算法非常復雜,即使在分辨率大幅縮放的情況下,也能提供出色的圖像質(zhì)量。舉例來(lái)說(shuō),雖然獲取遠距離物體的細節確實(shí)需要 2000 萬(wàn)像素,但可能只需要圖像的某個(gè)特定區域,而不是整個(gè)圖像。通過(guò)對這一動(dòng)態(tài)定義的區域進(jìn)行裁剪或縮放,就可以獲得 2000萬(wàn)像素傳感器的優(yōu)勢,而無(wú)需持續處理相當于 2000萬(wàn)像素的數據。
圖4 scaling比binning產(chǎn)生的偽影更少,從而提高圖像輸出效果
盡可能休眠,按需喚醒
傳感器可以處于極低的工作狀態(tài),在大多數工作時(shí)間內以低分辨率、最低幀速率運行。當檢測到運動(dòng)時(shí),它會(huì )切換到預定的配置--運動(dòng)喚醒(WOM)模式。圖像傳感器有能力處理這些變化,并讓 ISP/SoC 將其切換到所需的模式/配置。它還能進(jìn)一步屏蔽與應用無(wú)關(guān)的運動(dòng)區域,從而使傳感器和視覺(jué)系統更加精準、高效。以前,這一功能是在處理器中完成的,但在傳感器上實(shí)現這一功能可減少系統資源和功耗。
圖5 運動(dòng)喚醒等功能使視覺(jué)系統具有高度的目標驅動(dòng)性
我們可以看到這些功能在電池供電的應用、智能門(mén)禁系統、零售掃描儀、醫療監測系統等類(lèi)似應用中產(chǎn)生的深遠影響。電池供電的應用從這些傳感器中獲得了最大的好處,因為它們可以最大限度地降低系統功耗。在4K視頻門(mén)鈴應用中,像安森美AR0830這樣的800 萬(wàn)像素圖像傳感器在滿(mǎn)負荷狀態(tài)下會(huì )傳輸6G數據,但現在它可以在WOM模式下運行超過(guò)98%的工作時(shí)間。在預檢測階段,它產(chǎn)生/傳輸的數據量極低,整個(gè)視覺(jué)系統的運行功耗僅為全工作模式下的一小部分。
迄今為止,圖像傳感器作為數據捕捉和數據傳輸器件一直表現出色。正如安森美 Hyperlux LP 產(chǎn)品系列中所展現的那樣,上述趨勢和進(jìn)步使這些傳感器成為內置智能應用的強大邊緣器件。通過(guò)集成更好的像素技術(shù)、可配置的智能關(guān)注區域、運動(dòng)檢測等功能,現在可以被設計用來(lái)滿(mǎn)足特定的用例需求,從而打造出性能卓越且功耗極低的差異化高效視覺(jué)系統。
(作者:Onsemi公司 Ganesh Narayanaswamy)
免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問(wèn)題,請聯(lián)系小編進(jìn)行處理。
推薦閱讀:
探秘EVSE,全面解析電動(dòng)汽車(chē)供電設備
常見(jiàn)的傳統電源還能再戰智能邊緣時(shí)代嗎?