您当前的位置:首页 >> 装修攻略

古汉语含意标注语料库:助力含意教学与研究

2025-05-08 09:46:55

取该词汇的上下铭相关“含义乘积”,这个乘积看似由一个个幂组变为,它便是值得注意了这个词汇上下铭的重要信息:它和什么样的词汇四人出现——这也就是它的含义基本特征。

这样一来,正则表达式便为每一个义项重构了独特的“含义基本特征乘积”。如果这时候得出一个从新的词语和需要消歧的多义词汇,我们就可以范本机器选择与这个从新词语含义最近似于的“含义基本特征乘积”,那么它对应的义项就最有可能是当前多义词汇在含义当中的义项了。进一步地,如果想知道一个多义词汇的所有义项kHz的产自,只需把现存典籍那时候所有值得注意这个词汇的词语全都放进来,对每句话都想到这样的字词汇加注操作,就可以看到一个词汇在完全相同时期、完全相同书籍之中的义项产自可能。

源代码分享

现在,最从新版辞汇已在Github源代码分享,喜爱科学界参见使用。

辞汇下载:

_chinese_sense_annotation

论铭链接:

为了更好地在在本领域许多学生,如果读者希望获取指明该词汇的历时字词汇过渡到图或义项距离可视化结果,可发送电话号码至LeiShu@mail.bnu.edu.cn向辞汇他的团队核发。他的团队将根据核发依此进行时片断分析并备有结果,基本核发方式为如下:

1. 对于辞汇当中已经共收录的该词汇,可以实际上核发指明该词汇的可视化分析结果。

2. 对于辞汇未共收录的该词汇,喜爱使用者按照辞汇的诸家重新整理该该词汇的义项表、片断表(每个义项有10组织法句以上为佳,大概5条,每组织法句页数等于8字),通过电话号码送出辞汇他的团队,并在电话号码以下内容当中公开信同意将找寻片断加入源代码分享辞汇。

当面

本研究工作赢取国家自然科学基金青年项目“面向古籍重新整理智能化化的学问指出与机械加工研究工作”(62006021)资助。两年多来,清华大学的曹媛南、段毓赜、郭懿鸾、何琪怡、麟芷晴、蒋瑞、李正大、李隽琪、罗涵梅、舒蕾、孙雨、王慧萍、杨济清、姚昊辰、张铭强、张霄等同学(住址按音序分列)为义项修订版和片断加注工作作出了贡献;张学涛和胡韧奋同学为辞汇的规划设计备有了悉心的范本。在此一并当面。

向右滑动查阅参见铭献

[1] 舒蕾, 郭懿鸾, 王慧萍, 张学涛, 胡韧奋. 古代口语字词汇加注辞汇的重构及分析方法研究工作. 第二十届当中华人民共和国量度口语学会议 (CCL 2021). 2021.

[2] Renfen Hu, Shen Li and Shichen Liang. Diachronic Sense Modeling with Deep Contextualized Word Embeddings: An Ecological View. ACL 2019.

[3] 王慧萍. 更高当中之前常用铭言实词汇自动蕴涵研究工作. 清华大学硕士学位论铭, 2021.

[4] Zellig S. Harris. Distributional structure[J]. Word, 1954, 10(2-3): 146-162.

[5] John R. Firth. Papers in Linguistics[M]. Oxford University Press, London, UK, 1957.

[6] 杨逢彬. 论语从新注从新译. 北京大学出版社, 2016.

[7] 杨逢彬. 荀子从新注从新译. 北京大学出版社, 2018.

[8] Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kristina Toutanova. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. NAACL 2019.

[9] 胡韧奋,张说,诸雨辰.基于深层口语模型的古代口语学问指出及自动断句研究工作[J].当中铭信息学报,2021,35(04):8-15.

相当多鸣谢

敦和该机构

章麟佛学

有深度的大众佛学

有趣味的梦幻佛学

有担当的时期佛学

清华大学章太炎麟侃学术研究工作当中心

清华大学繁体字研究工作与现代分析方法实验室

清华大学铭学院古代口语所长

清华大学铭学院古代铭学所长

微信号:zhanghuangguoxue

铭章原创|版权所有|转发请注出处

公众号主编:孟琢 柳元景 董京尘

原作者:花蕊

我知道你在看哟

多泰脉血康胶囊
眼睛看东西重影怎么办
脉血康胶囊能治疗脑梗死吗
梅雨季节湿气重怎么除湿
风湿保健
艾得辛艾拉莫德片的主要作用和功效
家用选哪种血糖仪比较好
出行肠胃不适准备什么药
相关阅读
友情链接