面向数字人文的馆藏方志古籍地名自动识别模型构建


李娜 包平 ( 南京林业大学人文社会科学学院 南京农业大学中华农业文明研究院)

    

    
〔关键词〕 条件随机场 方志古籍 地名 馆藏资源

〔摘 要〕 在数字人文背景下,以馆藏方志古籍为语料库,以摘抄自地方志的农业专 题资料《方志物产》之山西分卷为例,在全文人工标注的基础上,构建基于条件随机场的古汉语地名自动识别模型,通过交叉验证方法测试模型的识别性能,用精确率 P、召回率 R 和 调和平均数 F 为测评指标,最佳的测试效果分别为 98.16%、91.55%、94.57%。结果显示, 条件随机场模型在基于人工标注的方志古籍语料上能够取得较好的识别效果,为深化图书馆馆藏古籍的整理利用提供借鉴。


参考文献:
1.Digital humanities [EB/OL]. [2017-05-29].https://en.wikipe dia.org/wiki/Digital_humanities.
2. Library and information science and digital humanities: two disciplines, joint future? [EB/OL]. [2017-05-29].https://core.ac.uk/ download/pdf/30446946.pdf.
3. Dalbello M. A genealogy of digital humanities [J]. Journal ofDocumentation, 2011, 67(3):480-506.
4. 李启虎 , 尹力 , 张全 . 信息时代的人文计算 [J]. 科学,2015, 67(1):35-39.
5. 吴建中 . 再议图书馆发展的十个热门话题 [J]. 中国图书馆学报,2017, 43(4):4-17.
6. 白寿彝 . 中国通史(第 1 卷)导论 [M]. 上海:上海人民 出版社,1989:292-294.
7. 唐旭日 , 陈小荷 , 许超 , 等 . 基于篇章的中文地名识别 研究 [J]. 中文信息学报,2010, 24(2):24-33.
8. 孙虹 , 陈俊杰 . 双层 CRF 与规则相结合的中文地名识 别方法研究 [J]. 计算机应用与软件,2014, 31(11):175-177.
9. 邱莎 , 阿圆 , 王付艳 , 等 . 基于统计的中文地名自动识 别研究 [J]. 计算机技术与发展,2011, 21(11):35-38.
10. 李丽双 , 党延忠 , 廖文平 , 等 . CRF 与规则相结合的中 文地名识别 [J]. 大连理工大学学报,2012, 52(2):285-289.
11. 黄德根 , 岳广玲 , 杨元生 . 基于统计的中文地名识别 [J]. 中文信息学报,2003, 17(2):37-42.
12. 黄德根 , 孙迎红 . 中文地名的自动识别 [J]. 计算机工程,


<<上一记录 下载显示的记录 打印显示的记录 推荐给你的朋友 下一记录>>

 

 湘ICP备000012  版权所有:湖南图书馆