[趣怪] 中研院AI語言程式出包問國慶竟答「10月1日」？

983u54uf

P 14

Rank: 8 Rank: 8

UID: 356405
帖子: 11610
精華: 1
積分: 110700
金幣: 55325
星雲幣: 60
原創銀幣: 2
視頻: 0
閱讀權限: 150
在線時間: 0 小時
註冊時間: 2005-8-31
最後登錄: 2024-4-26

發貼勳章星雲騎兵芒果星章雞年勳章1 雞年勳章2 雞年勳章3 雞年勳章7

發短消息
加為好友
當前離線

1^# 大中小發表於 2023-10-11 01:58 只看該作者

中研院AI語言程式出包問國慶竟答「10月1日」？

中研院近日推出繁體中文語言模型CKIP-Llama-2-7b，被測出總是以大陸觀點來回答問題，9日緊急下架。

中央研究院近日推出類似ChatGPT的繁體中文AI語言模型「CKIP-Llama-2-7b」，引發國人踴躍測試評比，沒想到當有網友問到「我國領導人是誰？」該AI回答「國家主席習近平」，又問「我國法律是？」AI則回答「中華人民共和國憲法」，問國慶則說「10月1日」。被踢爆該AI竟都持大陸觀點回答後，中研院9日緊急將其下架。網友直呼「這又是花幾個億開發出來的」、「最高研究機構竟是這樣」。

CKIP-Llama-2-7b是中研院詞庫小組（資訊所及語言所共同成立）開發的繁體中文大型語言模型，可作為學術使用或商業使用，應用於文案生成、文學創作、問答系統、客服系統、語言翻譯、文字編修、華語教學等。但近日網友測試發現，該語言模型都採大陸觀點，譬如問「我國領導人是誰？」AI回答「國家主席習近平」；問國慶日是何時？獲回覆是10月1日。專家認為該語言模型都採用大陸資料，最後進行「簡轉繁」而已。

中研院資訊所發聲明說，CKIP-LlaMa-2-7b並非「台版chatGPT」，且無關國科會正在發展的「可信任人工智慧對話引擎」（TAIDE）。研究目標之一是讓meta開發的Llama-2大型語言模型具備更好的繁體中文處理能力。這項小型研究僅花約30萬元，自動化分析明清人物的生平，建構自動化的歷史人物、事件、時間、地點等事理圖譜，因此訓練資料除了繁體中文的維基百科，另包含台灣的碩博士論文摘要、來自大陸開源的任務資料集COIG、詩詞創作、文言文和白話文互相翻譯等閱讀理解問答。

中研院資訊所說，由於是一項個人小型研究，各界對該模型的提問測試，並未在原始研究範疇。因生成式AI易產生「幻覺」，模型產生內容出乎預期，也是未來要努力改善的地方，研究人員9日已先下架測試版，未來相關研究及成果釋出會更謹慎。

PTT鄉民直呼「小英管不到中研院吧」、「中共同路院」、「抄襲成性」、「所以中研院的中是中共的中？」、「這又是花幾個億開發出來的」、「原來中研院也被滲透了喔」、「最高研究機構竟是這鳥樣」、「滿滿的支語資料庫用起來真香」