新的AI程序可以更好地檢測(cè)社交媒體中的壓抑性語(yǔ)言
使用人工智能的新技術(shù)比當(dāng)前系統(tǒng)更準(zhǔn)確地檢測(cè)社交媒體帖子中的壓抑性語(yǔ)言,并使用更少的數(shù)據(jù)來(lái)完成這項(xiàng)工作。在歐洲機(jī)器學(xué)習(xí)和數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)的原理與實(shí)踐會(huì)議上提出的這項(xiàng)技術(shù) 首次表明,為了更準(zhǔn)確地檢測(cè)出令人沮喪的語(yǔ)言,可以應(yīng)用小型高質(zhì)量的數(shù)據(jù)集。深度學(xué)習(xí),這是一種通常使用AI的方法,通常需要大量數(shù)據(jù)。
先前的心理語(yǔ)言學(xué)研究表明,我們每天與他人互動(dòng)時(shí)使用的詞語(yǔ)是我們心理和情緒狀態(tài)的良好指標(biāo)。
領(lǐng)導(dǎo)這項(xiàng)新研究的阿爾伯塔大學(xué)計(jì)算機(jī)科學(xué)博士學(xué)生Nawshad Farruque解釋說(shuō),過(guò)去嘗試使用深度學(xué)習(xí)技術(shù)來(lái)檢測(cè)和監(jiān)視社交媒體帖子中的抑郁癥是乏味且昂貴的。
他解釋說(shuō),在Twitter上發(fā)帖稱有人因?yàn)镹etflix倒閉而感到沮喪并不真正表示沮喪,因此有人需要對(duì)此算法進(jìn)行“解釋”。
“深度學(xué)習(xí)通常非常耗費(fèi)數(shù)據(jù),” Farruque說(shuō)。“基本上,您需要為您的機(jī)器提供很多示例,以供您嘗試教書(shū)。但是,帶有壓抑性語(yǔ)言的(專家級(jí))標(biāo)記數(shù)據(jù)很少出現(xiàn)。我們的工作大大減少了對(duì)如此大量標(biāo)記數(shù)據(jù)的需求。”
Farruque使用從在線抑郁癥論壇獲取的語(yǔ)言來(lái)教他的模型如何在推文中識(shí)別與抑郁癥相關(guān)的語(yǔ)言。新方法還可以幫助機(jī)器理解哪些單詞或單詞組合可以真正傳達(dá)沮喪的感覺(jué)。一個(gè)例子是“昨天很困難……今天和明天以及以后的日子也很困難”,與“昨晚不是一個(gè)好睡眠的夜晚……太累了,今晚我要演出……yawnnn”相比,這更是一種表達(dá)。沮喪
Farruque還在努力開(kāi)發(fā)其他使用表達(dá)語(yǔ)言的公共資源,包括自殺筆記和情書(shū),所有這些都可能有助于學(xué)習(xí)有關(guān)抑郁癥的健壯語(yǔ)言模型。
“這項(xiàng)研究的想法是在早期發(fā)現(xiàn)抑郁癥,以便人們可以盡快找到合適的資源,”在大學(xué)研究人員OsmarZaïane和Randy Goebel的監(jiān)督下工作的Farruque解釋說(shuō)。
Farruque相信,這項(xiàng)新技術(shù)有一天可能會(huì)內(nèi)置到Twitter的 自殘和自殺 政策中,并可能有助于改善Facebook已經(jīng)內(nèi)置的現(xiàn)有抑郁癥檢測(cè)算法 。