深耕東盟語料庫 暢通數(shù)字合作路
馬駿 自治區(qū)政協(xié)委員、南寧學(xué)院創(chuàng)新創(chuàng)業(yè)教育學(xué)院院長
唐平秋 自治區(qū)人大代表、廣西民族大學(xué)黨委書記
政府工作報告提到,打造高質(zhì)量數(shù)據(jù)集和東盟語料庫。這一部署精準(zhǔn)切中廣西與東盟數(shù)字合作的核心痛點。
“廣西作為中國與東盟唯一陸海相連的省區(qū),在東盟語料庫建設(shè)上具有天然優(yōu)勢?!瘪R駿委員表示,廣西與東盟國家地緣相近、人文相親、民心相通,長期積累了海量多語言原生語料,為獲取鮮活語言資源提供了便利。
語料庫是推動信息化建設(shè)、賦能數(shù)字化轉(zhuǎn)型、助力智能化升級的關(guān)鍵基礎(chǔ)要素。因此,區(qū)內(nèi)多所高校已前瞻布局東南亞語言與人工智能交叉學(xué)科,校企協(xié)同育人機制日益完善,初步形成專業(yè)化人才儲備與實踐梯隊。依托中國—東盟信息港平臺支撐,疊加“語料券”等政策工具賦能,以及“人工智能+跨境電商”等場景的持續(xù)拓展,進一步催生了東盟語料庫建設(shè)的迫切需求,為產(chǎn)業(yè)落地筑牢了基礎(chǔ)。
“東盟非通用語種語料庫建設(shè)是廣西人工智能領(lǐng)域的‘一號工程’,不僅賦能千行百業(yè)數(shù)字化轉(zhuǎn)型,筑牢人工智能倫理與安全防線,更為‘北上廣研發(fā)+廣西集成+東盟應(yīng)用’的人工智能發(fā)展路徑服務(wù)打通關(guān)鍵環(huán)節(jié),鋪就一條數(shù)字合作高速通道?!碧破角锎肀硎?,當(dāng)前廣西東盟語料庫建設(shè)已完成初步框架搭建,語種覆蓋雖初具規(guī)模,但高質(zhì)量細粒度標(biāo)注語料稀缺,尤其在口語對話、專業(yè)術(shù)語等領(lǐng)域缺口明顯,多數(shù)行業(yè)缺乏高質(zhì)量垂類語料庫;語料采集渠道多元但標(biāo)準(zhǔn)不一,數(shù)據(jù)復(fù)用率偏低,跨境支付與數(shù)據(jù)流通不暢等問題制約建設(shè)進程;越南語、泰語等核心東盟語種的標(biāo)注人才需求和標(biāo)注數(shù)據(jù)缺口較為突出。
針對這些問題,唐平秋代表建議,要加快搭建高水平語料庫科研平臺,整合高校、企業(yè)、科研機構(gòu)資源,集中攻關(guān)面向東盟非通用語種語料精準(zhǔn)標(biāo)注等核心技術(shù)。健全跨境數(shù)據(jù)治理機制,積極推動中國—東盟數(shù)字規(guī)則互認,打通數(shù)據(jù)流通壁壘,為語料合法合規(guī)使用提供制度保障。
記者 羅丹
來源:廣西云-廣西日報
中國—東盟商貿(mào)資訊平臺精選:
- 2026年02月19日 10:26:29
- 2026年02月07日 07:41:21
- 2026年01月26日 19:11:18









































京公網(wǎng)安備 11010202009201號