人工智能取得進展的跡象但何時才真正成為必需
亞當·切耶(Adam Cheyer)有一個夢想–考慮到他將自己的前兩家公司賣給了史蒂夫·喬布斯(Steve Jobs)和三星(Samsung),因此不放棄雄心壯志是明智的。
Cheyer是Siri的共同創(chuàng)建者,Siri是蘋果公司于2010年購買的開創(chuàng)性智能個人助理技術。他還是Viv的共同創(chuàng)始人,該公司創(chuàng)建了三星收購的下一代人工智能輔助系統(tǒng)。在2016年。盡管他在AI領域有遠見卓識,但Cheyer對于他的行業(yè)現(xiàn)狀并不滿意。
Cheyer的夢想是,人工智能驅動的助手對世界而言將變得與互聯(lián)網或移動技術一樣重要。在周四于舊金山舉行的Re-Work深度學習峰會上的一次露面中,Cheyer對虛擬助手尚未達到同樣重要的水平感到沮喪。
Cheyer抱怨說:“每天有數十億的查詢流經助手,但這并不重要。” “作為一個社區(qū),我們需要達到這一水平,或者至少要努力。”
Cheyer的懇求象征著當今AI和機器學習生態(tài)系統(tǒng)所面臨的難題。它是一項功能強大的技術,具有越來越多的有趣用例,但在全球范圍內是否必不可少?還沒有關閉-至少還沒有。
在深度學習峰會上的兩天中,與會者獲得了證據,盡管在機器學習算法的開發(fā)方面取得了進展,但虛擬個人助手和AI其他方面的影響仍然遠遠超出了預期。
正如Autodesk Inc.的對話工程師Nikhil Mane在一次會議上對與會者說的那樣:“如果您想正確地做到這一點,那么失敗一定可以。”
助手仍不完美
虛擬助手的普及率令人印象深刻,預計將有超過一半的智能手機采用該技術。但是,笨拙的界面以及難以完全掌握對話語音的能力仍然阻礙了虛擬助手的發(fā)展。
Cheyer指出,輔助技術仍然很難處理第三方集成。他舉了一個例子,用戶可以口頭檢查一下是否可以買到戲票,但隨后他們不得不掏腰包并使用其他應用來購買。
切爾說:“基本上,第三方是二等公民。” “它必須感覺像一種體驗。”
盡管許多研究人員在會議上提供了大量證據,證明語音識別技術已經取得了進步,但機器聽到的聲音與他們真正理解的聲音之間仍然存在差距。
Google LLC對話設計拓展負責人Cathy Pearl花費了大量時間測試助手及其理解水平。她舉了一個例子,其中一位同事保留了語音轉文本計算機程序并開始播放小號。計算機不僅將新的聲音解釋為音樂,還從字面上翻譯了它所聽到的“嗚嗚嗚嗚”。
在另一個示例中,Pearl問一個助手明天她當地的圖書館什么時候開放。谷歌研究人員從工作時間而不是工作時間中獲得了她所在地區(qū)“頂級”圖書館的清單,這證明了許多虛擬助手程序固有的偏向于從流行網站上挖掘數據。
Pearl說:“這些計算機實際上并沒有太多常識。” “這是人的天性。我們喜歡感到被理解。”
對抗網絡的進展
盡管Cheyer和Pearl等行業(yè)領導者感到沮喪,但在某些情況下AI和機器學習顯然具有真正的影響。
Google Brain的資深研究人員Ian Goodfellow(右圖)因其在生成對抗性網絡或GAN方面的開創(chuàng)性工作而在AI社區(qū)中脫穎而出。他將兩個神經網絡相互對抗的概念引起了機器學習領域的極大關注,“ GANfather”在會議上提供了進一步的進展證據。
Goodfellow展示了視頻片段,展示了機器如何使用GAN來解釋和處理一個人的舞步,并將它們完美地配音到另一個人的視頻圖像上。它還提出了一種希望,該技術可以為“假新聞”的定義賦予全新的含義。
最近,一組研究人員使用GAN來自動生成 可以3D打印的牙冠設計,并在數小時而不是數周內將其應用于患者。目前,該概念正在南加州的一小部分醫(yī)生中進行測試。
“我們實際上可以使用生成模型在現(xiàn)實世界中生成有用的對象,”古德費洛對聚會說。
視覺識別的進步也為視障者打開了新的大門。Seeing AI提供了一個基于AI的智能手機攝像頭應用程序,該應用程序允許視障人士以前所未有的方式看到周圍的世界。
該應用程序現(xiàn)在可以識別和顯示貨幣面額,房間中的人的描述及其與用戶的距離,手寫,店面名稱,數字以及鋁罐是可樂還是百事可樂。以AI為中心的應用程序使用了志愿者提交的數百萬張照片作為培訓數據。
Seeing AI應用程序的創(chuàng)始人,Aira Corp的人工智能和研究負責人Anirudh Koul(左)說:“我們的網絡已經開始變得更加強大。”
Beta項目顯示出希望
研究人員還在研究處于beta測試模式的新智能技術,隨著時間的推移,這種技術可能會變得越來越重要。Google正在通過一種名為“響應式搜索廣告”的開發(fā)中的新工具,將機器學習功能置于廣告商手中。
廣告客戶可以為一個促銷創(chuàng)建多達15個不同的標題和多達四個描述,然后將整個打包廣告提交給Google。然后,這家搜索巨頭使用其機器學習算法測試不同的組合,以確定最有可能獲得最佳點擊結果的版本。
另一位Google研究人員 Zornitsa Kozareva率先開展了一個將機器學習模型直接放置在設備上的項目。Kozareva以前曾在Amazon.com Inc.的Alexa上進行過開發(fā),一直在開創(chuàng)設備上神經網絡的使用,而Google已發(fā)布了一個名為Learn2Compress的機器學習套件, 以促進移動模型的發(fā)展。
一種潛在的應用是家用微波爐將配備自然語言處理功能和足夠的智能,以在用戶命令將其加熱意大利面時立即知道該怎么做。“我們正在努力突破界限,”科扎雷娃說。
AI的承諾是,有了足夠的數據,我們就可以在不完美的世界中提高完美水平。問題是,多少數據和機器學習最終將有所作為?
加州大學伯克利分校信息學院的博士后學者約書亞·克羅爾(Joshua Kroll)在周五的演講中警告說:“當您收集數據時,并不能完全反映世界 。” 亞當·切耶(Adam Cheyer)仍然相信助手將成為下一個全球變革性技術,但是他的夢想距離實現(xiàn)還很遙遠。