欢迎访问广东工业大学数据挖掘与信息检索实验室!

新加坡高等数字科学中心Vincent Zheng博士应邀到DMIR实验室作学术讲座预告

作者:DMIR    来自:    发表时间:2017-06-27    浏览量:227


报告时间2017年6月28日(周三)上午1000

报告地点:DMIR实验室

报告题目:基于异质图的语义相关度搜索

报告人:新加坡高等数字科学中心 Vincent Zheng(郑文琛)博士

报告人简介:

        郑文琛博士是新加坡高等数字科学中心的研究科学家和美国伊利诺伊大学香槟分校的研究员。他的研究兴趣主要集中在大规模互联网和社交媒体的数据采集,信息抽取和用户行为建模。他已经在国际顶级会议和期刊上发表超过50篇文章,总引用数超过1,500。郑博士也担任多个主要的人工智能和数据挖掘国际会议/期刊上的程序委员会委员。他现在是AAAI会员和ACM会员。他在2011年从香港科技大学博士毕业。 

报告摘要 :
        随着互联网和社交媒体的普及,图数据越来越丰富。在图数据上,一个很重要的任务就是语义搜索。该任务的目标是通过合理的方式和模型计算得到一个图上的任意两个节点之间的语义距离,用以支持更高阶的图数据应用,比如排序,推荐和链路预测等。在这个讲座里,我将分享两个我们最近完成的基于异质图的语义搜索工作。第一个工作是基于频繁子图挖掘(ICDE ’16)。我们注意到在异质图上,两个节点之间的语义关系通常可以由它们之间所包含的子图模式来描述,比如两个同学之间经常会共享学校和城市。我们通过在一个输入异质图上进行频繁子图挖掘,来找到对语义有效的子图。然后我们利用一个监督学习的方式来找出其中对于语义搜索有用的部分子图,以最好地预测任意两个输入节点之间的语义距离。由于子图匹配的复杂较高,我们提出了一个双阶段训练的学习算法和一个基于对称性的子图匹配算法来降低整个模型的计算复杂度。第二个工作是基于深度学习的语义相关度嵌入(AAAI ’17)。跟之前基于频繁子图挖掘的策略不同,我们考虑利用深度学习来自动学习复杂的节点连接关系。由于我们考虑的语义相关度涉及两个(可能非直接相连的)节点,我们发现传统的节点嵌入模型并不能很好地解决我们的语义搜索问题。所以我们提出了一个基于路径采样和序列化神经网络学习模型。我们总结这两种不同的语义搜索方法并在真实的社交网络数据上进行语义搜索的实验。我们发现,我们的模型可以比当前的算法更有效地解决语义搜素问题  

本次学术报告机会难得,欢迎感兴趣的师生前来参加。请提前10分钟入场入座完毕!