计算机软件及计算机应用论文_一种通过评价类别
【作 者】:网站采编
【关键词】:
【摘 要】:文章摘要:评价对象抽取主要用于文本的意见挖掘,旨在发掘评论文本中的评价对象实体。基于无监督的自编码器方法是研究该任务的重要方法,它可以识别评论语料库中潜藏的主题信息
文章摘要:评价对象抽取主要用于文本的意见挖掘,旨在发掘评论文本中的评价对象实体。基于无监督的自编码器方法是研究该任务的重要方法,它可以识别评论语料库中潜藏的主题信息,无需人工标注语料。针对自编码器抽取的评价对象缺乏多样性的问题,本文提出了一种基于监督学习的句子级分类任务和无监督学习的自编码器的混合模型。模型训练了一个分类器,生成评价对象类别。自编码器共享分类任务中的LSTM-Attention结构进行编码得到句向量表征,以增加语义关联度,再用得到的评价对象类别将句向量表征转化为中间层语义向量,从而捕捉到评价对象类别与评价对象之间的相关性,提高了编码器的编码能力,模型通过对句向量的重构进行解码,训练得到评价对象矩阵。最后通过计算评价对象矩阵与句中单词的余弦相似度来完成评价对象的抽取。通过在多领域评论语料库上的实验表明,与主流方法相比,模型一定程度上解决了训练过程缺少评价类别多样性的问题,并在餐厅领域中提升了3.7%,在酒店领域中提升了2.1%。
文章关键词:
论文DOI:10.19678/j.issn.1000-3428.0062992
论文分类号:TP391.1
文章来源:《应用数学学报》 网址: http://www.yysxxbzz.cn/qikandaodu/2022/0120/1546.html