大數(shù)據(jù)中的模式和異常現(xiàn)象可以幫助企業(yè)鎖定潛在客戶
大數(shù)據(jù)中的模式和異?,F(xiàn)象可以幫助企業(yè)鎖定潛在客戶,揭示欺詐行為甚至預(yù)測藥物相互作用。不幸的是,這些模式通常不容易觀察到。為了從大量數(shù)據(jù)中提取有用的信息,數(shù)據(jù)科學(xué)家需要越來越強(qiáng)大的機(jī)器學(xué)習(xí)方法。
德克薩斯大學(xué)達(dá)拉斯分校的電氣和計算機(jī)工程系Erik Jonsson杰出教授Aria Nosratinia博士獲得了科學(xué)基金會的兩項贈款,總額為749,492美元,用于通過機(jī)器學(xué)習(xí)發(fā)現(xiàn)隱藏在大數(shù)據(jù)中的關(guān)系,并開發(fā)保持方法數(shù)據(jù)通訊安全。
Erik Jonsson工程與計算機(jī)科學(xué)學(xué)院電氣與計算機(jī)工程副系主任Nosratinia表示:“我實(shí)驗室的貢獻(xiàn)是擴(kuò)大了工具和技術(shù)的范圍,以便我們可以發(fā)現(xiàn)數(shù)據(jù)中的新連接。”
許多機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法都使用圖形,這些圖形只是人,組或?qū)ο笾g的連接的列表。示例包括社交網(wǎng)絡(luò)中的“朋友”,“喜歡”或“關(guān)注”關(guān)系,或在流媒體訂閱服務(wù)中流式傳輸或標(biāo)記為“收藏夾”的視頻列表。
這些大量的數(shù)據(jù)隱藏了有用的信息,這些信息的提取屬于一個稱為圖推斷的區(qū)域。圖推理具有許多有趣且有用的應(yīng)用程序,例如,基于觀看歷史記錄在流服務(wù)中建議電影或在在線購物中購買建議。它還可以揭示流行病傳播的模式,或提供有關(guān)蛋白質(zhì)折疊的見解,這對于理解蛋白質(zhì)的功能非常重要。
Nosratinia的工作首次提出并分析了通過吸收非圖形信息來改善圖形推理的技術(shù),這些圖形信息與圖形信息的有效融合以前并未被很好地理解。非圖形信息的示例包括個人年齡和居住地郵政編碼。
Nosratinia說:“在幾乎所有涉及圖形的實(shí)際應(yīng)用中,都存在非相關(guān)的非圖形數(shù)據(jù)。” “我們所做的工作是在上游,開發(fā)數(shù)學(xué)模型,理論和技術(shù),但它具有廣泛的應(yīng)用。”
Nosratinia在幾本已發(fā)表的著作中描述了他和他的實(shí)驗室成員開發(fā)的數(shù)學(xué)模型,這些數(shù)學(xué)模型可以借助輔助信息來改進(jìn)對隱藏在圖中的信息的估計。Nosratinia和合著者Hussein Saad博士。“ 19,現(xiàn)為高通公司(Qualcomm Inc.)的高級工程師,最近分析了如何識別隱藏在大圖中的小型集群或社區(qū)。他們的最新工作發(fā)表在2020年12月的IEEE信息理論期刊。
Nosratinia研究的第二部分涉及數(shù)據(jù)安全性。他的工作利用了無線信道的自然變化,為數(shù)據(jù)傳輸提供了安全層。該工作領(lǐng)域稱為物理層安全性,旨在利用通信通道的缺陷作為安全性工具。這項研究的一部分旨在開發(fā)使網(wǎng)絡(luò)分子無法檢測到電子通信的技術(shù)。
Nosratinia說:“舉一個簡單的例子,密碼的工作原理是利用合法用戶和想要竊取信息的網(wǎng)絡(luò)罪犯之間的區(qū)別。” “我們的工作以不涉及密碼或密鑰的方式創(chuàng)建,放大和分析了針對對手的信息統(tǒng)計不對稱性,并將其用于保護(hù)通信。”