欢迎访问广东工业大学数据挖掘与信息检索实验室!

一种大规模跨平台基因表达数据分类方法

作者:DMIR    发表时间:2018-01-17    浏览量:31


发明人:蔡瑞初;侯永杰;郝志峰;温雯;王丽娟;许柏炎;陈炳丰

申请时间:2018年1月17日

专利申请号:201810043836.8

申请状态:实质审查


说明:本发明公开了一种大规模跨平台基因表达数据分类方法,包括以下步骤:S1、获取训练集,初始化分类器;S2、对训练集进行数据转换;S3、根据训练集计算相对偏移表;S4、生成候选偏序对,并计算出候选偏序对中的top偏序规则r;S5、更新分类器和训练集;S6、判断样本量与最小支持度θ的大小;S7、设定分类器CL缺省类;S8、预测分类。本发明针对跨平台基因数据挖掘这个问题,通过数据转换,提出了新的偏序对规则挖掘算法和分类模式,可以处理跨平台基因数据的差异性,不仅可以应对更复杂的数据分布,并且通过相对偏移表进行规则预筛选,显著提升了挖掘效率,能够应用于大规模数据上。