- +1
一史館13萬余件滿文朱批奏折數據庫將上線,使用方法搶先看
日前,中國第一歷史檔案館(以下簡稱“一史館”)在“改革開放四十年滿文檔案工作回顧與展望”座談會上正式發布了“滿文輸入通”“滿文識別通”軟件及“滿文朱批奏折全文檢索數據庫”。這是國內少數民族手寫體文字圖像計算機識別的首次成功應用。
“滿文識別通”
專家首先演示了“滿文識別通”軟件,它的功能是將滿文檔案的圖像信息通過識別技術轉換成可編輯檢索的文本信息。軟件界面如下:

在實際操作中,大批量數據加工在后臺進行,由機器操作,而具有滿文專業技能的人均可以參與校對,一定程度上緩解了滿文人才稀缺的壓力。
據介紹,這一系統的滿文行書識別率86.6%,滿文楷書識別率95.1%,處于國內外行業領先地位。同時軟件可以實現機器學習、迭代更新,隨著樣本庫的增加,識別率逐步提升。它的單機識別速度達到每小時625畫幅,相較于純人工每人每小時大約4畫幅的速度,效率顯著提高。此外,軟件易操作、兼容性強,基于微軟系統開發,對軟件和硬件環境要求不高,便于推廣使用。
“滿文輸入通”
“滿文輸入通”軟件包括滿文輸入法、滿文字庫、拉丁字母與滿文相互轉換軟件。
其中滿文字庫包含了團隊最新設計的幾種滿文字體,這些字體取材于一史館檔案中真實存在的滿文字體。




上圖演示中,左邊是滿文的拉丁字母轉寫,右邊是滿文。這一軟件能夠實現雙向轉換、批量轉換,既方便學者使用,也方便相關機構進行數據庫的建設。

滿文輸入法解決了滿文鍵位與滿文轉寫統一的難題,省略了切換按鍵。在文檔中,輸入滿文時可像漢語一樣切換字體,軟件設計了包括雕版體、奏疏體、行書體、匾額體、書名體和榜書體等字體供選擇;方便教學、科研和滿文古籍出版等工作。有學者提到,現在有些文物機構的滿語匾額書寫尚不規范,可以應用“匾額體”字庫來解決。

滿文朱批奏折全文檢索數據庫
應用“滿文識別通”及“滿文輸入通”開發的“滿文朱批奏折全文檢索數據庫”有滿文史料13萬余件,可以應用于局域網,也具備接入互聯網的能力。

以往檔案查詢只能依據著錄題名通過檢索檔號或者責任者來查詢檔案,有了全文數據庫以后,可以檢索檔案全文信息,檢索效率更高。


此外該數據庫還有后臺管理功能,為數據庫中的數據和使用者設置使用權限,包括是否能下載、閱讀,以保障數據安全。滿文朱批奏折全文檢索數據庫將于2018年12月3日起在中國第一歷史檔案館利用平臺向社會開放利用。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司