交流园地
当前位置: 首页 > 因公出访 > 交流园地 > 正文
刘世超赴希腊参加第12届知识科学工程与管理国际会议
时间:2019-10-16 发布者:国际合作与交流处 来源:

本人于 2019 8 27 日至 9 1 日赴希腊参加第12届知识科学工程与管理国际会议。参加此次会议,有助于促进具有共同领域研究者和从业者之间的交流,通过科学技术创新提高知识工程和知识管理等方面发展。会议期间做了一场题目为“Efficient Network Representations Learning: An Edge-Centric Perspective”的学术报告,并和在场的听众进行了深入的探讨和交流。

知识科学工程与管理国际会议(International Conference on Knowledge Science, Engineering and Management,以下简称为 KSEM)是知识科学相关领域领先的国际会议,其议题主要包括知识科学、知识工程和知识管理等方面,具有一定的国际影响力。KSEM 被中国计算机学会评级为 C 类国际会议(CCF C 类),这个跨学科会议的目的是为知识科学、知识工程和知识管理领域的研究人员提供一个交流思想和报告最新研究成果的论坛。

827日下午,在经历了十几个小时的飞行旅程后顺利抵达本次会议的举办酒店,稍事休息后就去注册的展厅进行会议注册,并结识了多位来自国内著名高校的老师和学生,也体现了国内学术界对本次会议的重视。次日早上九点钟在Europa Hall举行了会议开幕式,来自林肯大学的Stefanos Kollias教授做“Deep Neural Networks: Latent Information Extraction, Domain Adaptation & Uncertainty Estimation”的主题演讲。报告主要介绍了深度神经网络的发展和应用是当前最热门的研究内容,比如DNNCNNCNN-RNNGAN等模型常用于多个领域的分类、回归和预测,但同时也存在一些问题需要深入研究,包括从训练好的DNN中进行隐含信息抽取,如何对DNN的决策过程进行解释。Stefanos Kollias教授的课题组采用了迁移学习技术,K均值聚类和KNN分类的方法来解决上述问题。

为更好地了解本次会议研讨的内容,我研究了整个会议的议题分布情况,主要分为知识图谱领域和推荐系统领域。在会议过程中听取了近20场学术汇报,并同许多参会者交流了解了他们的最新研究成果,开拓了自己的视野;本会议所提供的资讯在我们的研究发展方向上有极为有利的助益,并且提供了许多新的概念和想法,使得我在学术视野上获益良多;在本次会议中,有一些跟我的方向相关的研究,这是吸引我的重点方向,我在了解别人的研究方法时也在时刻思考自己今后的研究还有什么地方可以提高与改进,这是收获最大的地方。

下面将一些重点关注的报告做详细地介绍:

报告一“TransI: Translating Infinite Dimensional Embeddings based on Trend Smooth Distance” 这是中国科学院大学信息工程研究所做的一个关于知识图谱表示的一个工作,比较有意思。目前的KG Embedding模型研究将固定规模的知识库的信息嵌入到固定维度的欧几里德空间,但是知识库不是一成不变的,会随着时间而扩大,这意味着实体的向量表示需要能够支持知识库的扩张。为了实现度量空间从有限空间到无限空间的扩展,必须克服三个挑战首先需要找到无限维向量的合理表示;第二,需要找到一种计算无限维向量之间的距离的方法;最后,需要找到一种适用于无限维向量梯度下降的方法。这篇文章假设,所有的实体和关系都可以表示为一个一元连续可微函数。连续可微函数,自变量等于有限维向量中每个维度分量的下标,在这个区间[0, 1]中有无限个函数的系数有无限种可能。也就是说,起伏的趋势有无限的可能性,在容量方面可以相当于无限的语义空间。这个函数,可以通过采样点,进行多项式拟合得到。这样原来的固定维数的特征,变为了多项式系数。

 

报告二“Named Entity Recognition in Traditional Chinese Medicine Clinical Cases Combining BiLSTM-CRF with Knowledge Graph” 这个是浙江大学做的一个关于中医处方命名实体识别的一个工作。中医处方,简称TCM相比于一般的命名实体识别技术有一些不同的地方。首先TCM的字和词一般都比较少见,处方的字词比较紧凑,相比于白话文,识别会比较困难。构建专有的知识图谱可以丰富实体的类型信息,通过结合KG,能够帮助神经网络获得更好的性能。作者将预训练的词级别向量作为LSTM的输入模型,通过knowledge attention vector model从候选实体中计算注意力最后进行输出到CRF层,这个候选实体通过在TCM KG中搜索得到。

 

报告三“Socially-aware and sequential embedding for cold-start recommendation” 这篇文章做的是使用CNN对用户点击序列进行特征提取。论文阐述了用户的行为序列和社会关系,对于用户的点击行为预测有重要影响。作者使用text-CNN对用户行为序列进行采集,并且通过 node2vec模型对用户的社会关系进行建模,集合起来可以提高推荐准确性。最后将学习到的向量拼接起来送入 MLP 模型进行CTR的预测。

 

报告四“PRTIRG: A Knowledge Graph for People-Readable Threat Intelligence Recommendation” 这篇文章是中国科学院大学信息工程研究所网络安全组做的工作。针对PRTI做的,叫做人可读的威胁报告。一般指的是网络上发布的网络安全的预警,类似之前出现的windows漏洞,比如比特币威胁。这个推荐是针对运维人员的,这样的一个推荐系统其实回归了本源,是一个信息过滤系统。首先,PRTI的数量日益增多,运维人员找到有用信息会比较困难。第二,PRTI的文本相比于新闻,结构更复杂。一般是中英混合的,并且包含安全项目、网络地址、攻击的组织等。现有的通用知识图谱噪音太多,无法直接应用于PRTI的推荐。PRTI推荐的挑战包含以下三个方面:PRTI的信息具有非常强的时效性,报告从发布到用户阅读,一般时间周期都不会很长;PRTI的信息复杂;通用的知识图谱,不适用与这种专业的推荐。 作者提出的模型输入为待选的PRTI 与用户交互过的PRTIs。所有的PRTI都会经过降噪实体抽取模块,构建知识图谱。使用KGTransE学习所有实体的向量表示。用户向量为所有交互过的实体的向量和待选PRTI为所有出现过的实体的向量的和,最后模型通过一个LSTM判断用户与item是否会有交互。

Copyright © 2019 版权所有:华中农业大学国际合作与交流部