跳到主要內容區塊

數位發展部推廣「臺灣主權 AI 訓練語料庫」申請事宜

一、為推動臺灣主權AI發展,數位發展部打造「臺灣主權AI訓練語料庫」,透過廣納高品質正體中文語料,支援AI模型訓練更貼近臺灣語言、文化與生活情境,促進AI模型具備更高的本土辨識力與語意理解能力。
二、語料庫目前已逾200個政府機關投入,透過各機關資料開放及數位發展部遴選後,上架累計超過3,000筆資料集,語料規模超過10億詞元(token)並持續擴充,收錄內容為各機關具臺灣文化特色之高品質資料集,涵蓋語言、文化、交通、教育、生物、地理環境等領域。
三、如有從事 AI 訓練、學習、開發、應用或相關研究內容者均可依申請須知及使用規範(附件)進行申請。
四、若有申請相關問題,請洽語料庫維運管理單位客服信箱(tsaitc@moda.gov.tw)。

檔案名稱 下載數 檔案大小
附件-臺灣主權AI訓練語料庫申請須知及使用規範.pdf 8 97KB
  • 資料更新:115-01-16 10:08
  • 資料維護:管理員