9月10日下午,中国科学院上海营养与健康研究所所级科学数据中心举办了“生物医学命名实体识别及消歧”培训,旨在帮助科研人员了解和掌握生物医学命名实体识别及消歧技术。本次培训由中心庄心昊博士担任主讲人。
庄心昊首先以新型冠状病毒数据为例,详细讲解了生物医学命名实体识别的概念和基本原理及其重要性。他指出,通过命名实体识别消歧,可以实现高效的信息检索。培训中,庄心昊介绍了UMLS、BERN、MetaMap等生物医学特有的术语库和工具,并探讨了命名实体识别完成后可以进行的一些应用,例如构建知识图谱和提供用药建议。此外,他还讲解了如何从大量文本中定位实体,从而更全面地理解实体之间的关系,并探讨了命名实体识别消歧在临床实验中的应用。最后,庄心昊分享了所级科学数据中心在命名实体识别消歧方面的研究成果,包括大模型NER方法、抗原肽识别及文本训练,同时他还对中心开发中的标注系统进行了展示。
培训过程中,学员们积极参与,踊跃发言,并与主讲人进行了深入交流和讨论。讨论内容涵盖了传统文本识别与大模型时代的区别、如何确定实体的来源、区分实体和属性、以及不同阶段在消歧中的关注点。
营养与健康所所级科学数据中心将持续举办相关主题的培训活动,以帮助更多的科研人员了解中心提供的保全、保供、增值、定制等四类服务。同时,所级科学数据中心还设计了相关的调研问卷(详见文末二维码),诚邀科研人员提出宝贵的意见和建议,以便进一步优化和提升服务质量。通过与科研人员的积极互动和反馈,中心将不断改进服务流程,提升技术支持质量,为进一步满足科研需求提供更加优质的服务。
庄心昊博士作培训报告