天下文訊您現(xiàn)在的位置是:湖南作家網(wǎng)>新聞資訊>天下文訊

DeepSeek寫的還是人寫的?用AI來識(shí)別

西湖大學(xué)發(fā)明可識(shí)別機(jī)器生成文本的AI工具,準(zhǔn)確率約90%

來源:文匯報(bào) | 劉琦   時(shí)間 : 2025-03-14

 

分享到:

隨著DeepSeek、ChatGPT等AI大語言模型的飛速進(jìn)化,機(jī)器生成內(nèi)容越來越“擬人”,“真假美猴王”的經(jīng)典橋段正在人工智能領(lǐng)域上演。日前,西湖大學(xué)教授張?jiān)李I(lǐng)銜的自然語言處理實(shí)驗(yàn)室研發(fā)出一款能夠識(shí)別機(jī)器生成內(nèi)容的AI程序Fast-DetectGPT,能夠以96%的準(zhǔn)確率識(shí)別ChatGPT生成文本,對(duì)DeepSeek生成文本的檢測準(zhǔn)確率達(dá)89%。

“真假美猴王”上演,誰是“如來”?

2023年12月發(fā)表在國際期刊上的一項(xiàng)研究,討論了頂級(jí)期刊的語言學(xué)家能夠在多大程度上區(qū)分AI寫作和人工寫作。72位語言學(xué)家參與了這項(xiàng)調(diào)研,結(jié)果顯示正確率不足40%。

事實(shí)上,機(jī)器生成的文本與人類生成的文本雖然看起來很像,但在語義、語法、用詞習(xí)慣等細(xì)節(jié)處理上存在許多不同。張?jiān)澜忉專瑱C(jī)器的思考偏向“統(tǒng)計(jì)性”,而人類的思考里除了“統(tǒng)計(jì)性”,還有“因果性”。具體體現(xiàn)在當(dāng)遇到困難,人類會(huì)反思,但這種能力大模型尚不具備。

張?jiān)肋M(jìn)一步解釋,以寫文章為例,AI的寫法是學(xué)習(xí)現(xiàn)有的數(shù)據(jù),從中挑選最“安全”的詞,也就是按照概率高低來選詞,這和人類寫作的創(chuàng)造性有本質(zhì)區(qū)別。例如在“我吃了一頓××”這個(gè)句式中,機(jī)器往往會(huì)在“吃”這一動(dòng)詞后使用搭配概率較高的“飯”,但人類可能會(huì)說:“我吃了一頓美味。”

研究團(tuán)隊(duì)認(rèn)為,人類和機(jī)器在給定上下文的情況下,詞匯選擇存在明顯差異,而機(jī)器與機(jī)器之間的這種差異并不明顯,這就是Fast-DetectGPT的工作原理。

另辟蹊徑,“以子之矛,攻子之盾”

有了原理,那么該如何操作?Fast-DetectGPT研發(fā)者之一、西湖大學(xué)博士生鮑光勝解釋,面對(duì)一句話或者一篇文章,F(xiàn)ast-DetectGPT會(huì)從AI的角度出發(fā)先想想,如果是自己寫會(huì)怎么寫?然后根據(jù)這個(gè)自問自答的參考答案,比對(duì)原文看看重合度有多高,相當(dāng)于“以子之矛,攻子之盾”。

具體而言,當(dāng)Fast-DetectGPT接收到一個(gè)文本片段,首先會(huì)在不改變?cè)獾那闆r下進(jìn)行改寫,把局部的同義詞替換掉,再將這份替換后的文本與原始文本進(jìn)行對(duì)比。如果原始文本是AI寫的,兩者的相似度會(huì)比較高。簡單來說,AI對(duì)AI寫的內(nèi)容更熟悉,可以“深入敵后”認(rèn)出同類作品。

據(jù)介紹,出于對(duì)AI安全性和可信賴方面的擔(dān)憂,歐美等國已有不少用AI檢測AI的研究,比如普林斯頓大學(xué)學(xué)生開發(fā)的GPTZero、斯坦福大學(xué)研究團(tuán)隊(duì)推出的DetectGPT等。此次由西湖大學(xué)研發(fā)的Fast-DetectGPT相較于DetectGPT的檢測速度提高了340倍,準(zhǔn)確率提升75%。

Fast-DetectGPT不僅對(duì)不同語種和內(nèi)容有良好的適用性,還能識(shí)別AI潤色和翻譯的文章。無論是人寫的經(jīng)由AI潤色或翻譯的文字,還是AI寫的經(jīng)由人潤色或翻譯的文字,都逃不過它的“法眼”。

AI持續(xù)進(jìn)化,矛更利還是盾更堅(jiān)?

盡管當(dāng)前的技術(shù)大幅提高了對(duì)AI生成文本識(shí)別的準(zhǔn)確性,但張?jiān)捞寡裕痪玫膶?,AI可能會(huì)發(fā)展出“反偵察”技術(shù),從而提高內(nèi)容識(shí)別難度,人與機(jī)器之間這種“矛”與“盾”的攻防角色會(huì)不斷互換、演進(jìn)。

另一個(gè)擔(dān)憂在于,當(dāng)人類吸收的語料中越來越多混入AI生成內(nèi)容,人類寫作會(huì)不會(huì)越來越接近AI?對(duì)此,張?jiān)辣硎荆S著互聯(lián)網(wǎng)上AI生成內(nèi)容的不斷增加,一批與AI相伴而生的年輕人可能也會(huì)逐步“學(xué)習(xí)”AI的表達(dá)風(fēng)格,但人類的表達(dá)始終具有“因果性”,與AI存在本質(zhì)區(qū)別。而在更遠(yuǎn)的未來,AI可能學(xué)會(huì)像人一樣思考,屆時(shí)識(shí)別難度可能更高。


湖南省作家協(xié)會(huì) | 版權(quán)所有 : 湘ICP備05001310號(hào)
Copyright ? 2005 - 2012 Frguo. All Rights Reserved