国产在线无码制服丝袜无码知名国产|国产免费久久精品44|东京热aⅤ无码一区二区|国产成人综合久久精品推最新

<menu id="koaeg"></menu>
  • <dd id="koaeg"><s id="koaeg"></s></dd>
  • <abbr id="koaeg"><abbr id="koaeg"></abbr></abbr><dfn id="koaeg"><input id="koaeg"></input></dfn>
  • <strike id="koaeg"></strike>
  • 東南教育網(wǎng)您的位置:首頁(yè) >動(dòng)態(tài) > 教育動(dòng)態(tài) >

    研究表明 廣泛使用的機(jī)器學(xué)習(xí)方法并不像聲稱的那樣有效

    導(dǎo)讀 分析復(fù)雜網(wǎng)絡(luò)的模型和算法被廣泛應(yīng)用于研究中,并通過(guò)其在在線社交網(wǎng)絡(luò)、搜索引擎和推薦系統(tǒng)中的應(yīng)用而影響整個(gè)社會(huì)。 然而,根據(jù)一項(xiàng)新的研究,一種廣泛使用的算法方法來(lái)建模這些網(wǎng)

    分析復(fù)雜網(wǎng)絡(luò)的模型和算法被廣泛應(yīng)用于研究中,并通過(guò)其在在線社交網(wǎng)絡(luò)、搜索引擎和推薦系統(tǒng)中的應(yīng)用而影響整個(gè)社會(huì)。 然而,根據(jù)一項(xiàng)新的研究,一種廣泛使用的算法方法來(lái)建模這些網(wǎng)絡(luò)是根本上有缺陷的,沒(méi)有捕捉到現(xiàn)實(shí)世界復(fù)雜網(wǎng)絡(luò)的重要特性。

    “不是這些技術(shù)給了你絕對(duì)的垃圾。 加州大學(xué)圣克魯斯分校巴斯金工程學(xué)院計(jì)算機(jī)科學(xué)與工程副教授C.“Sesh”Seshadhri說(shuō):“他們可能有一些信息,但沒(méi)有很多人相信的那么多。

    Seshadhri是3月2日發(fā)表在《國(guó)家科學(xué)院院刊》上的關(guān)于新發(fā)現(xiàn)的論文的第一作者。 這項(xiàng)研究評(píng)估了被稱為“低維嵌入”的技術(shù),這些技術(shù)通常被用作機(jī)器學(xué)習(xí)模型的輸入。 這是一個(gè)活躍的研究領(lǐng)域,新的嵌入方法正在迅速發(fā)展。 但Seshadhri和他的合著者說(shuō),所有這些方法都有同樣的缺點(diǎn)。


    為了解釋原因,Seshadhri使用了社交網(wǎng)絡(luò)的例子,這是一種熟悉的復(fù)雜網(wǎng)絡(luò)。 許多公司將機(jī)器學(xué)習(xí)應(yīng)用于社交網(wǎng)絡(luò)數(shù)據(jù),以生成關(guān)于人們行為的預(yù)測(cè)、對(duì)用戶的建議等。 嵌入技術(shù)本質(zhì)上將一個(gè)人在社交網(wǎng)絡(luò)中的位置轉(zhuǎn)換為幾何空間中一個(gè)點(diǎn)的一組坐標(biāo),為每個(gè)人生成一個(gè)可以插入到算法中的數(shù)字列表。

    “這很重要,因?yàn)橐恍┏橄蟮臇|西,比如一個(gè)人在社交網(wǎng)絡(luò)中的位置,可以轉(zhuǎn)換成一個(gè)具體的數(shù)字列表。 另一件重要的事情是,你想把它轉(zhuǎn)換成一個(gè)低維空間,這樣代表每個(gè)人的數(shù)字列表就會(huì)相對(duì)較小,“Seshadhri解釋說(shuō)。

    一旦進(jìn)行了這種轉(zhuǎn)換,系統(tǒng)就會(huì)忽略實(shí)際的社交網(wǎng)絡(luò),并根據(jù)空間中各點(diǎn)之間的關(guān)系進(jìn)行預(yù)測(cè)。 例如,如果在那個(gè)空間里與你親近的很多人都在購(gòu)買(mǎi)某一特定產(chǎn)品,系統(tǒng)可能會(huì)預(yù)測(cè)你可能會(huì)購(gòu)買(mǎi)相同的產(chǎn)品。

    seshadhri和他的合著者在數(shù)學(xué)上證明了復(fù)雜網(wǎng)絡(luò)的重要結(jié)構(gòu)方面在這個(gè)嵌入過(guò)程中丟失了。 他們還通過(guò)在不同類型的復(fù)雜網(wǎng)絡(luò)上測(cè)試各種嵌入技術(shù)來(lái)驗(yàn)證這一結(jié)果。

    “我們并不是說(shuō)某些特定的方法失敗了。 我們是說(shuō),任何給你一個(gè)小數(shù)字列表的嵌入方法都會(huì)從根本上失敗,因?yàn)橐粋€(gè)低維幾何對(duì)社交網(wǎng)絡(luò)和其他復(fù)雜網(wǎng)絡(luò)來(lái)說(shuō)是不夠表達(dá)的,“Seshadhri說(shuō)。

    三角形密度

    現(xiàn)實(shí)世界社交網(wǎng)絡(luò)的一個(gè)關(guān)鍵特征是三角形的密度,或三個(gè)人之間的聯(lián)系。

    “如果你有很多三角形,那就意味著社交網(wǎng)絡(luò)的那一部分有很多社區(qū)結(jié)構(gòu),”Seshadhri說(shuō)。 “此外,當(dāng)你看到社交網(wǎng)絡(luò)有限的人時(shí),這些三角形就更重要了。 在一個(gè)典型的社交網(wǎng)絡(luò)中,有些人有很多聯(lián)系,但大多數(shù)人沒(méi)有很多聯(lián)系。

    在對(duì)嵌入技術(shù)的分析中,研究人員觀察到許多代表社區(qū)結(jié)構(gòu)的社會(huì)三角形在嵌入過(guò)程中丟失。 “所有這些信息似乎都消失了,所以就像你想找到的東西在構(gòu)造這些幾何表示時(shí)丟失了一樣,”Seshadhri說(shuō)。

    低維嵌入絕不是唯一用于生成預(yù)測(cè)和建議的方法。 它們通常只是一個(gè)非常大和復(fù)雜的機(jī)器學(xué)習(xí)模型的許多輸入之一。

    “這種模型是一個(gè)巨大的黑匣子,很多積極的結(jié)果被報(bào)道說(shuō),如果你包括這些低維嵌入,你的表現(xiàn)會(huì)上升,也許你會(huì)得到一個(gè)輕微的顛簸。 但如果你自己使用它,似乎你會(huì)錯(cuò)過(guò)很多,“Seshadhri說(shuō)。

    他還指出,新的嵌入方法主要與其他嵌入方法進(jìn)行比較。 然而,其他研究人員最近的實(shí)證研究表明,不同的技術(shù)可以為特定的任務(wù)提供更好的結(jié)果。

    “假設(shè)你想預(yù)測(cè)誰(shuí)是共和黨人,誰(shuí)是民主黨人。 有專門(mén)為這項(xiàng)任務(wù)開(kāi)發(fā)的技術(shù)比嵌入更有效,“他說(shuō)。 “這種說(shuō)法是,這些嵌入技術(shù)適用于許多不同的任務(wù),這就是為什么很多人采用它們的原因。 也很容易將它們插入到現(xiàn)有的機(jī)器學(xué)習(xí)系統(tǒng)中。 但對(duì)于任何特定的任務(wù),事實(shí)證明,總有更好的事情可以做。

    鑒于機(jī)器學(xué)習(xí)在我們社會(huì)中的影響越來(lái)越大,Seshadhri說(shuō),調(diào)查模型背后的基本假設(shè)是否有效是很重要的。

    “我們所有這些復(fù)雜的機(jī)器都在做影響我們生活的事情。 我們的信息只是,我們需要更小心地評(píng)估這些技術(shù),“他說(shuō)。 “特別是在機(jī)器學(xué)習(xí)越來(lái)越復(fù)雜的今天和時(shí)代,對(duì)什么可以做,什么不什么是不能做的有一些了解是很重要的。

    除了Seshadhri,論文的合著者包括谷歌的Aneesh Sharma、UCSC研究生Andrew Stolman和斯坦福大學(xué)的AshishGoel。 這項(xiàng)工作由國(guó)家科學(xué)基金會(huì)和陸軍研究室資助。

    鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如有侵權(quán)行為,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。