欢迎访问广东工业大学数据挖掘与信息检索实验室!

一种融合双信息源的文本多标签分类方法

作者:DMIR    发表时间:2017-05-02    浏览量:132


发明人:温雯;陈颖;蔡瑞初;郝志峰;王丽娟;陈炳丰

申请时间:2017年5月2日

专利申请号:201710301194.2

申请状态:实质审查


说明:本发明涉及一种融合双信息源的文本多标签分类方法,通过网络获取文本数据,将每篇文本按不同信息源分成信息源一和信息源二,并且将不同信息源文本分别采用空间向量模型表示,通过特征矩阵构建融合多种不同视角和特点的信息源的分类器,预测待分类的文本数据,得到分类标签结果,本发明设计合理、计算简单、预测准确,通过将具有不同视角和特点的两种信息源融合在模型中,提高了分类的准确性,避免了现有技术中分别对信息源构建分类器,再对多标签分类结果进行融合,导致忽略不同信息源之间、不同标签的相关性的问题,另外,通过将模型的求解过程转换成特征值的求解,不仅进一步简化了计算过程,而且还进一步提高了模型训练效率。

系统设计总图: