斯坦福大學實驗發(fā)現(xiàn)人類在圖像壓縮時擊敗了算法
您的朋友給您發(fā)了一張她即將收養(yǎng)的狗的照片,但您看到的只是棕褐色,模糊不清的動物形狀的像素霧。為了讓您更清楚,她將鏈接發(fā)送到狗的收養(yǎng)資料,因為她擔心自己的數(shù)據(jù)限制。只需單擊一下,屏幕上就會充滿更加令人滿足的描述,以及她將來可能成為最好的朋友的圖像。
發(fā)送鏈接而不是上傳大量圖像只是人類用來傳遞信息而又不消耗數(shù)據(jù)的一種技巧。實際上,根據(jù) 斯坦福大學教授和高中生團隊的研究,這些技巧可能會激發(fā)出一類全新的圖像壓縮算法 。
研究人員要求人們比較傳統(tǒng)壓縮算法產(chǎn)生的圖像,該算法將大圖像縮小為像素模糊,與人類在數(shù)據(jù)受限條件下創(chuàng)建的圖像(純文本通信,其中可能包括公共圖像的鏈接)進行比較。在許多情況下,人力圖像共享產(chǎn)品被證明比算法的工作更令人滿意。研究人員將在2019年數(shù)據(jù)壓縮會議上介紹他們的工作。
“我們今天擁有的幾乎所有圖像壓縮器都使用不一定能代表人類在圖像中所重視的指標進行評估,”電氣工程專業(yè)的研究生,論文的合著者Irena Fischer-Hwang說。“事實證明,我們的算法還有很長的路要走,并且可以從人類共享信息的方式中學到很多東西。”
該項目是由電氣工程學教授Tsachy Weissman領(lǐng)導(dǎo)的研究人員與在其實驗室實習的三名高中生之間的合作產(chǎn)生的 。
“坦率地說,我們參加這項合作的目的是為學生提供一些不會對正在進行的研究造成太大干擾的東西,”韋斯曼說。“但是他們想做更多的事情,而楚茲帕(chutzpah)導(dǎo)致了該組織的論文和全新的研究方向。這很可能成為我參與過的最激動人心的項目之一。”
損失更少的圖像
將圖像轉(zhuǎn)換為壓縮格式(例如JPEG)會使圖像明顯變小,但會丟失一些細節(jié)–因此,這種轉(zhuǎn)換形式通常稱為“有損”。由于算法必須犧牲有關(guān)顏色和亮度的詳細信息以消耗較少的數(shù)據(jù),因此生成的圖像質(zhì)量較低。盡管算法在大多數(shù)情況下都保留了足夠的細節(jié),但魏斯曼的實習生認為它們可以做得更好。
在他們的實驗中,兩名學生遠程合作,使用免費的照片編輯軟件和互聯(lián)網(wǎng)上的公共圖像來重新創(chuàng)建圖像。該對中的一個人擁有參考圖像,并指導(dǎo)第二個人重建照片。雙方都可以看到重建過程,但描述者只能在聽對方講話時通過文本進行交流。
重建圖像的最終文件大小是描述者發(fā)送的文本消息的壓縮大小,因為這是重新創(chuàng)建該圖像所需要的。(該組不包含音頻信息。)
然后,學生將人工重建與文件大小等于重建文本文件大小的機器壓縮圖像進行對比。因此,如果人類團隊僅用2 KB的文本創(chuàng)建圖像,則他們會將原始文件壓縮為相同大小。在訪問原始圖像后,實驗之外的100個人對13個圖像中的10個圖像的人工重建的評價優(yōu)于基于機器的壓縮。
面孔模糊
當原始圖像與互聯(lián)網(wǎng)上的公共圖像(例如街道路口)緊密匹配時,人為重建的效果特別好。甚至結(jié)合了各種圖像的重建效果也很好,除非出現(xiàn)人臉特征。研究人員沒有要求法官解釋他們的排名,但是他們對發(fā)現(xiàn)的差異有一些想法。
“在某些情況下,例如自然風光,人們并不介意樹木是否有些不同,或者長頸鹿是不同的長頸鹿。他們更關(guān)心圖像不是模糊的,這意味著傳統(tǒng)壓縮的排名較低。”魏斯曼小組的研究生,該論文的合著者Shubham Chandak說 。“但是對于人臉,即使表面模糊,人們也希望擁有相同的面孔。”
隨著越來越多的人將自己的圖像上傳到互聯(lián)網(wǎng),基于人的圖像共享中的這種明顯的弱點將得到改善。研究人員還與素描藝術(shù)家合作,以了解他的專業(yè)知識如何產(chǎn)生影響。即使這項工作顯示了人工輸入的價值,研究人員最終仍將嘗試使該過程自動化。
魏斯曼研究小組的研究生,該論文的合著者Kedar Tatwawadi說:“機器學習正在研究其中的一部分,希望我們能盡快使它們一起工作 。” “看起來像使用這種意識形態(tài)的實用壓縮機并不遙遠。”
魏斯曼說:“數(shù)以十萬計的人類工程時間花在了設(shè)計一個算法上,三個高中生來了,并踢了它的屁股。” “考慮我們在工程領(lǐng)域的工作真是令人沮喪。”
由于這項合作的成功,魏斯曼 在他的實驗室為高中生創(chuàng)建了一個正式的 夏季實習計劃。想像藝術(shù)家或?qū)π睦韺W或神經(jīng)科學感興趣的學生如何為這項工作做出貢獻,他特別熱衷于吸引興趣和背景各異的學生。
資料來源:斯坦福大學