11月14日,科罗拉多大学Kevin B Cohen博士来到我校,在信息学院314会议室作了以“临床文本与大数据”为主题的报告。报告全面介绍了自然语言处理在生物医学文本挖掘中面临的挑战和机遇。
Kevin B Cohen博士现为科罗拉多大学医学院生物医学文本挖掘项目组主任,科罗拉多大学计算语言学(主要涉及生物医学自然语言处理)的科学项目主席。Kevin博士作为自然语言处理尤其是生物医学自然语言处理方面的专家,著有《Biomedical Natural Language Processing》一书,在生物医学文本处理领域具有较深的研究积淀。
生物医学文本挖掘在大数据背景下,讲求自然语言处理与大数据技术相结合,用于解决生物医学中的问题,具有广阔的应用前景。Kevin指出,由于该项研究对象属于文本的非结构化数据,在广度和深度上均具有极大挑战性。接着,Kevin例举了生物医学的文献数据和临床医学、电子病历数据的一些重要区别。最后,Kevin以几个实例,介绍了现在面临这些挑战时研究者的一些重要方法和思路。
会后,听众就该领域中涉及的机器学习的算法、非结构化数据的处理的方法与思想、电子病历文本数据挖掘中遇到的问题,与Kevin进行了深入交流。