基于乱序语言模型字嵌入的医疗命名实体识别方法分析

2022.12.30点击:

摘要:阐述中文电子病历命名实体的识别效果,采用乱序预训练语言模型PERT模型进行词嵌入,构建PERT-BiLSTM-CRF电子病历实体识别模型,于CCKS2018数据集上,与BERT模型进行对比。提出的模型实体识别效果F1值达到了93.75%。实验表明,对于病历文本中的一句话,连续单词的前后顺序调换并不影响其语义,使用PERT模型进行词嵌入,能够提高模型的泛化能力,并且加入BILSTM-CRF层进行上下文语义的获取以及约束能够提高命名实体识别的准确性。

关键词: 计算机技术; 实体识别; PERT模型; 乱序语言模型;

基金资助: 宁夏自然科学基金(2020AAC03122); 宁夏医科大学理学院科研项目(NYLXY20210006,NYLXY20210012);

专辑: 医药卫生科技;信息科技

专题: 医学教育与医学边缘学科;计算机软件及计算机应用

分类号: R-05;TP391.1