人工智慧和物聯網推動第三波攝影浪潮
靜態影像。然後是電影。下一步:融合動態、熱成像和其他資料的相機,更全面瞭解我們週遭的世界。
攝影仍然是人類最喜愛的發明之一。當 19 世紀初攝影的第一波浪潮出現後,藝術家和記者便很快地用它來記錄各種影像,包括可怕的戰爭,以及輝煌的古文明等。1888年,喬治·伊士曼 (George Eastman) 發表了第一台傻瓜相機,隨之而生的系列相機,讓即使不是專家的人也能記錄他們的生活。
攝影的第二波浪潮始於 1878 年 6 月 18 日,當時艾德沃·馬布里奇 (Eadweard Muybridge) 在賽場上拍攝了馬匹奔馳的一系列高速影像。當時艾德沃與人打賭,馬在奔跑時會四蹄騰空,這段知名的連續影像證明了這一點,也啟動人們探索電影的開端。好萊塢、電視和 24 小時不停的新聞播送也應運而生。
圖片和影片共同主宰著網際網路。據估計在 2021 年,人類拍攝了 1.4 兆張照片 (其中幾乎 100% 的照片是使用 Arm 架構的智慧型手機、平板電腦和智慧型相機所拍攝),而影片更佔了網際網路流量的 70% 以上。
那麼,在第三波的浪潮中會發生什麼事呢?有賴於處理能力的不斷提高,和採用人工智慧 (AI) 的電腦視覺,「攝影機」將成為一種可擷取多重感官輸入,並將其交織成更豐富、全面,以及對週遭世界更富有深入見解的成像裝置。您將能夠捕捉到肉眼可見,以及平常看不見的事物。
使用光達成像拍攝的熱點照片
電腦視覺是在物聯網 (IoT) 中擷取真實世界資料的基礎。此部落格由 Arm 的物聯網和嵌入式技術副總裁撰寫,探討在商業、工業和家庭應用中,Arm 技術如何為智慧攝影機提供安全的生態系統。
利用技術重建像人眼一樣強大的感測器,為電腦執行以往需要人類視覺的任務,開闢了廣泛而多樣的使用場景 - 因此也難怪電腦視覺正迅速成為在物聯網 (IoT) 中擷取和處理真實世界資料最重要的方式之一。
但智慧相機不僅能捕捉到人類所能看到的事物。透過各種成像技術來瞄準電磁頻譜的不同範圍,它們也越來越擅長捕捉我們無法看到的東西。
以熱資料為例。熱成像儀發明於 1920 年代,數十年來主要由軍事或實驗室技術人員與工程師使用。在 2000 年代,由於價格下降和效能的提昇,使承包商能夠使用熱成像設備來查明房屋中的氣隙。儘管熱運動並非大眾認知中必要的應用範圍:我們多數人能想像最接近的情境,便是實境節目《Ghost Hunters》(幽靈獵人) 所呈現的景象。
然而 COVID-19 的爆發使得校園、博物館和其他高人員流量的設施,突然需要一種準確、快速和非接觸的方式,來查找異常的體溫。採用人工智慧強化後的熱成像儀 (內建適當的隱私機制),將逐漸被納入智慧型建築平台,用以改善健康情況,降低能耗,並實現計畫性維護及生產最佳化等複雜的人工智慧任務。
在不久的將來,熱成像將不僅僅是用在生死攸關的地方,現在透過附加模組,它也會在智慧型手機中變得更加普遍。想像一下,在多名玩家的擴增實境 (AR) 遊戲中新增了一個感熱元件。熱增強成像將有效地讓玩家掌握目標或對手的方位和地點。
或者考慮將影片串流與動態資料相結合,並使用 AI 進行分析。可以根據您自己的行為自訂手勢導覽的數位電視能夠將 AI、動態感應和視覺資料串流融合到網路攝影機中。
老人照護?多重感測器和攝影機提供的資料,將使老年人能夠獨立生活更久的時間,同時讓家人安心,家人能夠掌握生命徵象監控功能如血氧程度 (無論有無穿戴式裝置),甚至是高齡長輩製作三明治的影片片段。
汽車與攝影機的融合
現在來談談汽車。光達或光線偵測和測距系統,使用一組對人眼安全的雷射光來建立一個人週遭區域的動態 3D 影像。David Hall 是 Velodyne 的工程師,他在 2005 年第二屆 DARPA 機器人車輛挑戰賽上首次發表了採用光達技術的原型車。雖然他的車輛並未完賽,但在 2007 年的下一次挑戰中,六名完賽者中便有五名仰賴光達技術。
與此同時,Lucid 表示該廠於明年推出的轎車,將納入採用光達技術的 DreamDrive Pro 自動駕駛平台,而 LeddarTech 則正在努力標準化光達技術以降低成本。
熱成像技術也將整合到車載攝影機中。Adasky 表示,該公司的 Viper 相機結合了熱成像技術,視覺成像和機器學習,可以偵測 300 公尺處的物體,並對 200 公尺處的活體進行分類。而頭燈卻只能提供約 80 公尺的能見度。
您還可以結合哪些其他應用?一些公用事業公司正在尋找將瓦斯外洩視覺化的方法,並將其整合到影片串流和地圖中,以協助維修人員或消防員。智慧型手機中嵌入了嗅覺感測器、攝影機、機器學習和一些巧妙的圖形,可以幫助您在大型雜貨賣場陳列中找到最熟的橘子,或者讓您避免拿到已經過期的熱狗。
當然我們也不能遺漏 3D 技術。這在 50 年代和 2010 年代都流行過,但運算攝影、人工智慧、新的螢幕技術,以及 CAD 模型與多重影像的融合,也正在產生不會讓觀眾感到噁心,且逼真、身臨其境的影像。
車載技術革命
當然,所有這些成果都需要付出努力。電腦視覺和其他運用於融合感測器串流或強化影像的 AI 應用程式,很大程度上必須在相機本身上運作,以節省時間和能耗。例如,在全球估計約 7.7 億個監控攝影機上進行影像分析,而非將資料傳送到雲端,每年可以減少超過 19 萬噸二氧化碳的產生,同時也加強隱私保護。先進攝影也將需要 64 位元處理器,其中包含圖形專用的特定處理核心和神經網路處理器,以及傳統的 CPU。
運算型儲存,許多運算任務發生在儲存磁碟機的範圍內,也將在先進攝影中找到早期市場。同樣,機器學習演算法、處理器和其他元件也必須經過精心設計以提高能源效率,以使靠電池供電的設備不會在關鍵時刻失去作用。隨著時間的推移,軟體定義的方法將進一步使硬體製造商或應用程式開發人員輕鬆加入新功能。
所有這些研發工作將在對更高解析度和更多功能的強烈要求中同時進行。從 1080p 進步到 4K 將使智慧相機的資料速率增加一倍,這種成長將持續增加到 8K,以及每秒 30 幀到 60 幀的轉變。更精密的攝影機也將代表駭客的攻擊面更大,因此可期待看到專用的加密處理器。
用光與技術繪圖
有人可能會說,這種融合已超越了攝影本身了。攝影的意思最終代表著「用光繪圖」。新增感官輸入,或技術上來說純屬虛構的逼真影像,已超出了現今攝影機的範圍。但對於公眾來說,攝影機的功能一直是在盡可能準確地捕捉真實 – 只是這種「現實」的範圍將變得更大。
換句話說,將感官輸入融合到一個單一、更聰明的裝置中,會給人們帶來他們真正想要的:一個更全方位的景象。