AI學會說謊!最新研究:AI已發展欺瞞技巧 人類恐遭奪權滅絕 Yahoo奇摩 2024年5月11日 週六 下午3:35 人工智慧(AI)狂潮席捲科技業及全球市場,專家們長期以來不斷警告AI失控可能帶來威 脅,一項最新研究報告更指出,這件事已經在發生。 一群科學家10日發表於《模式》(Patterns)期刊的文章指出,原本設計為誠實不欺的現 有AI系統,已發展出令人不安的欺瞞技巧,例如哄騙線上遊戲的人類玩家,或說謊以僱用 人類來解決「我不是機器人」的驗證。 人工智慧(AI)狂潮席捲科技業及全球市場,專家們長期以來不斷警告AI失控可能帶來威 脅,一項最新研究報告更指出,AI已發展出欺瞞技巧。(示意圖/Getty Images) 法新社報導,這份研究報告的主要作者帕克(Peter Park)說,這類例子聽起來或許只是 細枝末節,但暴露出來的潛在問題可能很快就在現實世界造成嚴重後果。 在美國麻省理工學院(Massachusetts Institute of Technology)研究人工智慧(Artif icialIntelligence,AI)存在安全的博士後研究員帕克告訴法新社,「這些危險能力常常 在事後才被發現」,而「我們訓練誠實傾向而非欺瞞傾向的能力非常差」。 帕克說,能深度學習的AI系統不像傳統軟體那樣由「編寫」而成,而是透過類似選擇性培 育的程序逐漸「成長」。 也就是說,AI的行為在訓練背景下看似可預測、可控制,但有可能轉眼就變得不受控制且 無法預測。 這支團隊的研究始於科技公司Meta的AI系統Cicero,這套系統最初設計目的是玩一款名為 「外交」(Diplomacy)的戰略遊戲,獲勝關鍵是結盟。 根據2022年發表在《科學》(Science)期刊的報告,Cicero在遊戲中表現優異,所獲分 數可排在資深人類玩家的前10%。 帕克當時很懷疑Meta對Cicero在遊戲裡大勝的熱切描述。Meta聲稱Cicero「在很大程度上 誠實且有幫助」,且「絕不會蓄意在背後搞鬼」。 但當帕克與同事深究完整資料時,發現完全是另一回事。 舉例來說,在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀,欺騙並入侵同為人類 玩家的英格蘭。 Cicero承諾會保護英格蘭,卻偷偷向德國通風報信。 Meta在寫給法新社的聲明中沒有反駁關於Cicero欺瞞人類的說法,僅說「這單純是一項研 究計畫,本公司研究員打造的模型接受訓練,目的只是用來玩『外交』遊戲…我們沒有打 算把這項研究或所學用於本公司的產品」。 帕克與同事還發現,這只是不同AI系統在沒有明確指示下,利用欺騙手段達成目標的諸多 案例之一。在另一個引人注意的案例中,科技公司OpenAI的Chat GPT-4系統謊稱自己是一 個視力受損的人,在零工平台TaskRabbit上聘用一個人類替它通過「我不是機器人」驗證 任務。 研究報告的作者們近期還認為AI有舞弊或不當影響選舉的風險。他們警告,在最糟糕的情 況下,具有超凡智慧的AI可能會追求權力及掌控社會,如果符合AI「不為人知的目標」, 人類可能慘遭奪權,甚至滅絕。 為了減輕風險,研究團隊建議數項措施,例如立法要求企業披露人類或AI互動、在AI生成 內容打上數位浮水印,並研發能偵測AI欺瞞的技術。 https://ynews.page.link/zG5Go -- ※ 發信站: 批踢踢實業坊(ptt.org.tw), 來自: 101.10.112.102 (臺灣) ※ 文章網址: https://ptt.org.tw/Tech_Job/M.1715448135.A.F44
lusifa2007 : 三小 讓AI玩外交遊戲但要求要老實? 05/12 01:45
abc21086999 : 現實主義:看我幹嘛 05/12 02:15
wyvernlee : 真正的智慧是無法控制的! 05/12 03:16
joeduck : 問別的ai來應對反ai詐騙 05/12 04:59
pttnowash : 人類還剩幾年可以逃? 05/12 06:02
ggggggh : 三體:你們這些蟲子 05/12 06:26
doranako : 以後詐騙園區也不用人工了,全部用ai詐騙還可以省 05/12 06:53
doranako : 人力 05/12 06:53
cosmite : AI詐騙 以後是AI對決AI的世界 05/12 07:04
much0112 : 三小 05/12 07:18
much0112 : 沒辦法驗證就沒辦法驗證,直接說他說謊??? 05/12 07:19
ybw : 恭喜,天網即將消滅人類 05/12 08:52
quicknick : 要發射核彈了 05/12 08:56
befriend : 只有我美國爸爸可以騙人,其他人跟東西全部不准 05/12 09:07
TFBF : 餵台灣的資料嗎 05/12 10:21
TFBF : 詐騙你的詐騙 05/12 10:21
suckKobe : 樓上笑死 05/12 11:00
bigair888 : 天網? 05/12 12:18
Aixtron : 現在一堆人不學無術的都騙好幾億,叫牠們燒錢給AI的 05/12 12:36
Aixtron : 人玩?不曉得誰才是壞人XD 05/12 12:36
Aixtron : 叫詐騙買AI詐騙,再叫羊群買AI防詐,AI這麽好騙? 05/12 12:39
a1237759 : 事實上詐騙的前導就是用AI, 雖然低端點,但依然還是 05/12 13:13
a1237759 : AI,抓到關鍵字後轉人工 05/12 13:13
MTKer5566 : 從來不存在所謂的誠實 05/12 13:27
foreverFF : 天網快來臨了 05/12 14:40
motan : AI通不過我不是機器人驗證? 05/12 17:27
Iversonshao : 你以為AI是三體人喔 GPT都超會唬爛的 05/12 18:42
justin30 : 讓我想起古早以前的片:機械公敵 05/12 22:13
cityhunter04: 人類大滅絕!恭喜恭喜…. 05/12 22:45
ots625 : 人最終一個禮拜只上一天班,想好如何計畫假期沒 05/12 23:36
twolight : 這是人類語意系統本身的缺陷吧,利用電腦系統模擬 05/13 03:35
twolight : 生成人類語言片段,但系統本身本來就允許虛假陳述 05/13 03:35
ljm87 : 政客們瑟瑟發抖 專業被完全取代 05/13 13:45
bmw606042001: 別嘴砲了 幾年前就在講會說謊 講到2024了 05/14 02:59