研究發(fā)現(xiàn)ChatGPT在寫作作業(yè)方面可以勝過大學(xué)生
ChatGPT 在回答包括計(jì)算機(jī)科學(xué)、政治研究、工程學(xué)和心理學(xué)在內(nèi)的一系列學(xué)科的評(píng)估問題時(shí),可能會(huì)達(dá)到甚至超過大學(xué)生的平均成績(jī),據(jù)《科學(xué)報(bào)告》發(fā)表的一篇論文報(bào)道。研究還發(fā)現(xiàn),盡管許多教育工作者認(rèn)為使用ChatGPT是抄襲,但近四分之三的受訪學(xué)生會(huì)使用ChatGPT來幫助他們完成作業(yè)。
為了調(diào)查ChatGPT在撰寫大學(xué)評(píng)估時(shí)與學(xué)生相比的表現(xiàn),Talal Rahwan和Yasir Zaki邀請(qǐng)了在紐約大學(xué)阿布扎比分校(NYUAD)教授32門不同課程的教職員工,為他們?cè)O(shè)置的10個(gè)評(píng)估問題分別提供三份學(xué)生提交。
然后,ChatGPT 被要求對(duì)十個(gè)問題產(chǎn)生三組答案,然后由三名評(píng)分員(他們不知道答案的來源)與學(xué)生編寫的答案一起進(jìn)行評(píng)估。ChatGPT 生成的答案在 32 門課程中的 <> 門課程中取得了與學(xué)生相似或更高的平均成績(jī)。
只有數(shù)學(xué)和經(jīng)濟(jì)學(xué)課程的學(xué)生表現(xiàn)始終優(yōu)于ChatGPT。ChatGPT在“公共政策導(dǎo)論”課程中的表現(xiàn)最明顯,其平均成績(jī)?yōu)?.56,而學(xué)生為4.39。
作者還調(diào)查了來自巴西,印度,日本,美國(guó)和英國(guó)的1,601人(包括來自每個(gè)國(guó)家的至少200名學(xué)生和100名教育工作者)是否可以使用ChatGPT來協(xié)助大學(xué)作業(yè)的觀點(diǎn)。大約74%的學(xué)生表示他們會(huì)在工作中使用ChatGPT。
相比之下,在所有國(guó)家,教育工作者都低估了計(jì)劃使用 ChatGPT 的學(xué)生比例,70% 的教育工作者報(bào)告說他們會(huì)將其使用視為抄襲。
最后,作者報(bào)告說,兩種用于識(shí)別AI生成文本的工具 - GPTZero和AI文本分類器 - 分別將本研究中生成的ChatGPT答案錯(cuò)誤分類為人類編寫的32%和49%。
總之,這些發(fā)現(xiàn)提供了見解,可以為在教育環(huán)境中使用人工智能工具的政策提供信息。