neural蜕变是褒义还是贬义义

 上传我的文档
 下载
 收藏
粉丝量:11
该文档贡献者很忙,什么也没留下。
 下载此文档
面向微博文本的分词及情感分析研究
下载积分:1850
内容提示:面向微博文本的分词及情感分析研究
文档格式:PDF|
浏览次数:8|
上传日期: 18:03:28|
文档星级:
全文阅读已结束,如果下载本文需要使用
 1850 积分
下载此文档
该用户还上传了这些文档
面向微博文本的分词及情感分析研究
关注微信公众号豆丁微信公众号
君,已阅读到文档的结尾了呢~~
产品网络评论挖掘研究,产品评论挖掘,在线评论信息挖掘研究,网络新闻评论研究,评论挖掘,淘宝可信评论挖掘,淘宝评论数据挖掘代码,数据挖掘研究院,数据挖掘研究生,数据挖掘研究现状
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
产品网络评论挖掘研究
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='http://www.docin.com/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口  摘要:针对目前大部分情感分析技术需要人工标注建立情感词典提取情感特征的问题,提出一种基于对比散度受限玻尔兹曼机(CDR" />
免费阅读期刊
论文发表、论文指导
周一至周五
9:00&22:00
基于对比散度受限玻尔兹曼机深度学习的产品评论情感分析
  摘要:针对目前大部分情感分析技术需要人工标注建立情感词典提取情感特征的问题,提出一种基于对比散度受限玻尔兹曼机(CDRBM)深度学习的产品评论情感分析方法。该方法在对产品评论时进行数据预处理并利用词袋模型产生产品评论的向量表示,然后通过CDRBM提取产品评论的情感特征,最后结合支持向量机(SVM)将提取出来的情感特征进行文本情感分类。CDRBM无需人工标注情感词典,即可获得情感特征,且可以提高特征的情感语义关联性;同时,SVM可以保证产品评论情感分类的准确度。通过实验确定了RBM最优训练周期为10,在此训练周期下对RBM、SVM、PCA+SVM,以及RBM+SVM方法进行了比较。实验结果表明,RBM特征提取和SVM分类结合方法能够获得最好的准确率和F值,并获得较好的召回率。 中国论文网 http://www.xzbu.com/8/view-7316911.htm  关键词:深度学习;受限玻尔兹曼机;情感分析;对比散度;支持向量机   中图分类号:TP391.4 文献标志码:A   0引言   随着淘宝、京东、卓越、当当等购物网站的流行,越来越多的人开始网上购物,网上的评论信息也越来越多。网购者往往会留下评论来对所购买的商品表达自己的情感,评论信息会成为其他潜在消费者以及商家的一个重要参考依据。然而,面对如此巨大的无结构评论信息,客户、商家无法及时准确地发现自己想要的产品参考信息。如果单靠人工浏览的方式去浏览这些信息十分费时,而且获得的信息带有一定的片面性[1]。因此,利用计算机帮助用户快速、完全地获取和整理这些相关的评价信息,以及对互联网上杂乱无章的海量产品评论信息进行挖掘处理,并对评论中蕴含的情感进行情感倾向性分析成为了近些年来的一个研究热点。   情感分析是指分析说话者在传达信息时所隐含的情绪状态,对说话者的态度、意见进行判断或者评估。情感分析在海量数据上的应用,将有助于完善互联网的舆情监控系统,拓展企业的营销能力,实现对物理世界异常或突发事件的检测;此外,还可以应用于心理学、社会学、金融预测等领域的研究,故对于产品评论情感分析的研究有着很重要的现实意义[2]。   目前,对于网络商品评论情感分析的主要方法有:1)基于情感知识的方法,主要依靠一些已有的情感词典和语言知识,来对文本的情感倾向进行分类[2];2)基于特征分类的方法,主要是使用机器学习的方法,将情感分析看作传统的分类,抽取特征并进行判断。王文华等[3]针对产品评论中的属性词和情感词在文本中的各种关系,制定了八组特征选择规则,利用支持向量机(Support Vector Machine, SVM)算法训练模型来判断属性词和情感词的搭配识别,并依据情感词及否定词等分析属性特征的情感倾向;杨立公等[4]提出一种基于马尔可夫逻辑网的句子情感分析方法,与深度学习(deep learning)方法结合实现跨领域的知识迁移,同时采用马尔可夫逻辑网将句子的上下文信息与其他情感特征相结合实现句子情感分析;Ruslan等[5]提出无向二部图受限玻尔兹曼机(Restricted Boltzmann Machine, RBM)应用在用户对电影评论的排名上;Glorot等[6]提出了一种领域自适应大规模情感分类,即采用去噪的自动编码机,后又将去噪自动编码机以栈的方式堆叠起来,就得到栈式去噪编码机,实现了从底层特征到高层特征,并且提取观点持有者对某一方面的情感表示;姚娜娜[7]将情感词典与SVM结合进行产品评论的情感分析;Pang等[8]分别用朴素贝叶斯、最大熵、SVM算法等机器学习算法进行情感分析,但需要建立情感词典;Dave等[9]在对产品评论进行情感分类时,采用Bigram作为特征项训练分类器;Kim等[10]手工收集了一些褒义和贬义的词汇,借助WordNet同义词扩展这个集合,通过对词语同义词组在原始褒义词集合和贬义词集合的对比,计算词语的褒贬置信度,最后根据阈值判断词语极性;Collobert等[11]提出运用深度学习对文本进行词性标注、命名实体识别、语义角色标注等任务,但没有用于情感分析。   上述针对情感倾向性分析方法中关键部分是特征提取和情感词典的建立,即情感分析的准确性取决于特征质量的高低、特征数量的多少及情感词典建立的准确性。然而,特征提取比较费时和费力,而且依赖专业知识和直觉,且情感词典的建立也比较繁琐。   本文针对上述方法存在的问题并结合产品评论文本非结构化的特点,提出了一种既能有效降低文本表示模型的维度,又无需建立情感词典,通过概率大小对文本数据进行情感分析的对比散度受限玻尔兹曼机(Contrastive Divergence RBM, CDRBM)方法。这个方法可通过一种深层非线性网络结构,实现复杂函数逼近来表征输入数据分布式表示,可用较少的参数表示复杂的函数。训练时各隐藏层无需经验和人工技巧,通过无监督的逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,可使分类或预测更加容易。   3实验及结果分析   本文的实验是在Eclipse平台上,用python语言实现。实验数据来自数据堂电子产品相关的中文评论语料的1706篇评论文本中,分别有853条正向评论,853条负向评论。实验中训练集和测试集按3∶1随机挑选。表1为对评论语料中其中一条评论的特征提取结果。   实验结果利用准确率、召回率和F值三个指标评估方法的性能[15]。F值是综合考虑准确率和召回率。   准确率=提交结果中与人工标注匹配数目提交的所有观点句的数目×100%   召回率=提交结果中与人工标注匹配数目人工标注结果中观点句的数目×100%   F值=2×准确率×召回率准确率+召回率×100%   为了测试受限玻尔兹曼机及其深度体系的情感分析性能,进行了两种不同类别的实验。   1)测试RBM模型受参数k的影响。   表2和图3给出了隐含层节点个数为2时,在不同k值下RBM对产品评论的不同识别结果,即准确率、召回率和F值。从表2和图3可知,当k=10时,精确度达到最高,同时召回率和F值也最高,即情感倾向性分析较好,所以在下面实验时,选择k为10。
  2)不同方法的评论情感分析结果比较。   令k=10,将本文提出的RBM特征选择与SVM结合的算法(RBM+SVM),与RBM情感分析算法、SVM情感分类算法、主成分分析PCA和SVM结合的算法(PCA+SVM)进行比较[16]。其中:基于SVM的情感分类算法没有考虑到原特征空间的噪声,没有进行降维处理;PCA+SVM的算法主要是采用在进行SVM分类前采用经典的降维算法PCA进行特征降维。本文将RBM+SVM算法与这两个算法比较验证采用RBM进行特征降维,并用SVM算法进行分类是否能有效提高情感分类精度。   RBM情感分析算法,仅用了RBM方法,把RBM作为一个判别模型进行分类,判别出产品评论的情感正向或负向。设置RBM隐层层单元数为2,用0、1表示。其中:0表示判断该产品评论情感为负向,即用户对该产品持消极的态度;1则表示此时判断的产品评论情感为正向,即用户对该产品持积极的态度,用户喜欢该产品。将RBM的情感分类结果与单独采用SVM的结果进行比较。在PCA和SVM结合的方法中, 运用PCA对高维数据进行降维处理,将抽取出的低维特征作为SVM的输入,然后再用SVM进行情感分析判别。在RBM和SVM结合的方法中,设置RBM的隐藏层单元数为50。不同方法的实验结果如表3和图4所示。   通过实验可看出:   1)基于RBM算法的效果比SVM算法的效果好,表明RBM作为一种无监督分类模型,采用逐层无监督训练的方法,不需要人工设计运用概率进行特征提取,相对于浅层SVM模型,RBM模型能更紧凑高效地表达显示问题中的非线性特征,对于产品评论具有很好的分类效果。   2)基于RBM和SVM两者结合的方法,即把RBM看作是一种降维的特征提取方法,把提取的特征运用到SVM方法中,相对于运用PCA的特征提取方法效果更好,表明RBM用数学的方法进行选取,找出了一些最具分类信息的特征,人为因素干扰少,是一种比较精确的降维特征选择方法;而PCA是一种从原始输入数据中经过降维选取最重要的前n个特征,是一种特征映射和统计方法,人为因素较多,没有考虑特征词在类间的分布和特征词在类内部文档中的分布情况。   4结语   本文在分析文本结构和情感表达特点的基础上,提出了一种基于RBM的文本情感分析模型,对文本情感进行分析。实验结果显示,与传统机器学习方法相比,本文提出的这种情感分析方法明显提高了情感识别的准确率;相对于其他的特征提取方法,RBM作为降维的特征提取方法对情感识别的准确率也有明显的提高作用。由于用深度学习方对文本进行情感分析,不需要建立情感词典,因此其可用于不同领域中进行情感分析,所以在后继的研究中,将探讨运用有条件RBM方法进行不同领域的情感分析。   参考文献:   [1]   任远远, 王卫平. 中文网络评论的产品特征提取及情感倾向判定. 计算机系统应用, 2014, 23(11): 22-27.(REN Y Y, WANG W P. Extracting product features and determine sentiment orientation from Chinese online reviews[J]. Computer Systems & Applications, 2014, 23(11): 22-27.)   [2]   张春霞, 姬楠楠, 王冠伟. 受限波尔兹曼机简介[EB/OL]. []. http://www.paper.edu.cn/releasepaper/content/.(ZHANG C X, JI N N, WANG G W. Introduction of restricted Boltzmann machines[EB/OL]. []. http://www.paper.edu.cn/releasepaper/content/.)   [3]   王文华, 朱艳辉, 徐叶强, 等. 基于SVM的产品评论属性特征的情感倾向分析[J]. 湖南工业大学大学学报, 2012, 26(5): 76-80.(WANG W H, ZHU Y H, XU Y Q, et al. Analysis on emotional tendences of attribute characteristics in product reviews based on SVM[J]. Journal of Hunan University of Technology, 2012, 26(5): 76-80.)   [4]   杨立公, 汤世平, 朱俭, 等. 基于马尔科夫逻辑网的句子情感分析方法[J]. 北京理工大学学报, 2013, 33(6): 600-604.(YANG L G, TANG S P, ZHU J, et al. A Markov logic network based sentence sentimental analysis method[J]. Transactions of Beijing Institute of Technology, 2013, 33(6):600-604.)   [5]   RUSLAN S, ANDRIY M, GEOFFREY H. Restricted Boltzmann machines for collaborative filtering [C]// Proceedings of the 24th International Conference on Machine Learning. New York: ACM, 2007: 791-798.   [6]
  GLOROT X, BORDES A, BENGIO Y. Domain adaptation for largescale sentiment classification: a deep learning approach[EB/OL]. []. http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.231.3442.   [7]   姚娜娜. 基于机器学习的产品评论情感分类研究[D]. 北京:首都师范大学, .(YAO N N. Research on sentimental classification of product reviews based on machine learning[D]. Beijing: Capital Normal University, .)   [8]   PANG B, LEE L, VAITHYANATHAN S. Thumbs up? Sentiment classification using machine learning techniques[C]// EMNLP 2002: Proceedings of the ACL02 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA, USA: Association for Computational Linguistics, 2002, 10: 79-86.   [9]   DAVE K, LAWRENCE S, PENNOCK D. Mining the peanut gallery: opinion extraction and semantic classification of product reviews[C]// WWW 2003: Proceedings of the 12th International Word Wide Web Conference. New York: ACM, 2003: 519-528.   [10]   KIM S M, HOVY E. Determining the sentiment of opinions[C]// COLING 2004: Proceedings of the 20th International Conference on Computational Linguistics. Stroudsburg, PA, USA: Association for Computational Linguistics, 2004: Article No. 1367.   [11]   COLLOBERT R, WESTON J. A unified architecture for natural language processing deep neural networks with multitask learning[C]// ICML 2008: Proceedings of the 25th International Conference on Machine Learning. New York: ACM, 2008: 160-167.   [12]   LAUZON F Q. An introduction to deep learning[C]// Proceedings of the 2012 11th International Conference on Information Science, Signal Processing and Their Applications. Piscataway, NJ: IEEE, 2012: .   [13]   YOUNES L. On the convergence of Markovian stochastic algorithms with rapidly decreasing ergodicity rates[J]. Stochastics: An International Journal of Probability and Stochastic Processes, 1999, 65(3/4): 177-228.   [14]   CARREIAPERPINAN M A, HINTON G E. On contrastive divergence learning[EB/OL]. []. http://www.gatsby.ucl.ac.uk/aistats/fullpapers/217.pdf.   [15]   HAN J W, MICHELING K, JIAN P. 数据挖掘概念与技术[M].3版.北京:机械工业出版社, 7.(HAN J W, MICHELING K, JIAN P. Data Mining: Concept and Techniques [M]. 3rd ed. Beijing: China Machine Press, 7.)   [16]   唐慧丰, 谭松波, 程学旗. 基于监督学习的中文情感分类技术比较研究[J]. 中文信息学报, 2007, 21(6):87-94.(TANG H F, TAN S B, CHENG X Q. Research on sentiment classification of chinese reviews based on supervised machine learning techniques[J]. Journal of Chinese Information Processing, 2007, 21(6): 87-94.)   Background   This work is partially supported by the National Natural Science Foundation of China (), the Science and Technology Planning Project of Hunan Province (), the Foundation of Key Laboratory of Autonomous Systems and Networked Control, Ministry of Education (2013A11).   GAO Yan, born in 1973, Ph. D., associate professor. Her research interests include intelligent information processing, Web intelligence, data mining.   CHEN Baifan, born in 1979, Ph. D., lecturer. Her research interests include artificial intelligence, machine learning   CHAO Xuyao, born in 1991, M. S. Her research interests include intelligent information processing.   MAO Fang, born in 1991, M. S. candidate. Her research interests include intelligent information processing and pattern recognition.
转载请注明来源。原文地址:
【xzbu】郑重声明:本网站资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们删除已转载的信息。
xzbu发布此信息目的在于传播更多信息,与本网站立场无关。xzbu不保证该信息(包括但不限于文字、数据及图表)准确性、真实性、完整性等。 上传我的文档
 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
基于深度语义特征的情感分析研究
下载积分:1000
内容提示:基于深度语义特征的情感分析研究
文档格式:PDF|
浏览次数:21|
上传日期: 11:54:27|
文档星级:
全文阅读已结束,如果下载本文需要使用
 1000 积分
下载此文档
该用户还上传了这些文档
基于深度语义特征的情感分析研究
关注微信公众号豆丁微信公众号
君,已阅读到文档的结尾了呢~~
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
基于SVM与RNN的文本情感关键句判定与抽取
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='http://www.docin.com/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口}

我要回帖

更多关于 事无巨细褒义还是贬义 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信