天上人间分享 http://blog.sciencenet.cn/u/terahertz 淡泊明志,宁静致远 liuguifeng29@163.com

博文

一种基于主题模型与迁移学习的文本分类方法

已有 1959 次阅读 2021-6-21 08:20 |个人分类:发表论文|系统分类:论文交流

(本文发表于山东科技大学学报(自然科学版)2021年第3期P80-88)



摘要:为了消除传统机器学习中分类方法的限制,提出一种基于主题模型与迁移学习的文本分类方法。将文本集合成由共同主题和特定主题所联合起来的混合模型;然后,通过这两类主题相关性推断出不同领域之间主题的映射关系;最后,融合共同主题以及映射后的特定主题形成一个新的特征空间,并在此特征空间中完成文本的分类。实验结果表明,相较于其他分类方法,本方法在国外的20newsgroups数据以及自建的中国专利数据集上能更加高效准确地预测未标记文本的类别,为文本挖掘领域相关方向的研究提供新的视角。 


关键词:文本分类;主题模型;迁移学习;源领域;目标领域

2021-一种基于主题模型与迁移学习的文本分类方法.pdf




https://blog.sciencenet.cn/blog-39723-1292019.html

上一篇:镇江市图书馆
下一篇:南通博物院
收藏 IP: 222.186.101.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-26 03:54

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部