- +1
顏真卿把“刺史”錯寫成了“刾史”?這個智能平臺可以判斷
在5月28日開展的華東師范大學“冷門絕學”專業“新文科”建設成果發布會上,華東師范大學中國文字研究與應用中心(下簡稱“文字中心”)發布了“智能型中國文字數字平臺”等應用成果,文字中心副教授郭瑞在現場通過平臺演示回應了這個問題。

智能識別-刺字 本文圖片均為華東師范大學供圖(除署名外)
他用“刾”字舉例,進入“智能檢索中國文字數據庫”,用“石刻疑難字形智能識別器”識別唐代文字中貌似“刾”的那個字,識別結果即呈現“刺”字。而進一步搜索“刺”,可以看到從秦代、兩漢、魏晉南北朝、隋唐時期的石刻、抄本等多種載體上,有大量形似“刾”的文字。
“從出土文獻的材料看,寫成‘刾’是顏真卿時代的主流字形。且經過上溯,也可以看到這個字形的流變。”郭瑞說。

智能識別-刺字關聯檢索 隋唐五代
電子版“字海”,也能識別圖像
“智能型中國文字數字平臺”的平臺建設已走過20余年,目標是將中國歷代出土的實物文字材料都納入可以運用數字化來處理和研究的范圍。
相較于此前的數據庫類型,文字中心的平臺數據庫包含的文字材料已覆蓋自殷商甲骨到明清文字各種時段的各種類型:先秦部分,基本囊括目前已公布的資料;先秦以后匯集了各時段主要代表性材料。
“平臺可提供覆蓋整個漢字發展史的相關文字信息的定量性檢索查詢,堪稱電子版的‘字海’。”會上,文字中心副主任劉志基說。
另外,澎湃新聞記者從華東師大了解到,“中國文字智能檢索數據庫”是國內目前唯一一種可全字符檢索的出土文字數據庫。研發團隊通過海量文獻用字的逐一整理,研發了完整的出土實物文字字符集標準體系,保證了數據庫各種資料都處于有效的數字化處理的范圍內。
此外,研究團隊將圖像識別工具與數據庫進行結合, 降低了數據庫使用者的專業知識門檻,掃除使用者不識之字就不能使用數據庫檢索查詢的“盲點”。

發布會現場 澎湃新聞見習記者 鄒佳雯 圖
系統助力“古文字學”,別的領域也能用
“冷門絕學專業樹德育人數字化智能助學系統”也是當天會上發布的重要成果之一。
2020年,華東師大開始招收“強基計劃(古文字學)”方向學生,但對于這樣講究積累且相對艱深晦澀的學科,學習與教學難度都很大。
如今,依托系統中不同層次支撐屬性的系列數據庫,學生可以由淺入深地學習;另外,通過“漢字美育智能資源庫”,學生可以檢索如金文鳥蟲書材料、瓦當材料等歷史漢字中最富美飾性的種類。
郭瑞告訴記者,除了用作“強基計劃(古文字學)”的助學系統,該系統對如相關歷史考古哲學研究、書法藝術研究及創作、社會文創等領域的工作者也將發揮作用。
接下來,團隊還將在探索提高平臺搜索精度與速度、對未曾出現的古文字進行識別預測、探索單字可能出現的拓片等領域進行進一步的研究。

強基系統-考釋檢索

強基系統-美育庫





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司