词向量和深度学习在文本情感分析中的应用

主讲人:薛云(华南师范大学教授)
时间:2017年9月18日上午9:30   地点:N702

【摘要】随着电子商务的快速发展,网络口碑传播的作用不断凸显,而Web2.0模式的兴起更使得网络评论的情感分析技术日益受到重视。但目前的主流分类方法大多属于浅层学习模型,不能提取文本中丰富的语义特征,针对复杂分类问题其泛化能力受到制约。近年来兴起的深度学习方法能够自动学习特征的层次结构,具备强大的特征表达能力和对复杂任务的建模能力,因此将其应用于情感分析问题可以提升模型性能,并免去繁琐的特征提取步骤,摆脱对情感词典等人工资源的过多依赖。而词向量作为深度学习背景下的新兴技术,可以将每个词语映射到特殊的语义向量,在相似功能的词语拥有近似向量表达形式的假设下,为每个词语分配一个定长实数向量。词向量能有效捕捉文本的语义和句法功能,并在一定程度上通过对词向量进行简单的代数运算可以发现对应词语的语言规律,从而克服了词袋模型一些固有的不足。本报告将对词向量和相关深度学习模型的发展过程进行简单回顾,并结合情感分析问题进行讨论,希望与拥有机器学习和数学背景的朋友就这一领域的问题和方法展开交流。

【个人简介】薛云,1997年7月,湘潭大学计算数学与应用软件专业本科毕业;2000年7月,中科院数学与系统科学研究院运筹学与控制论专业硕士研究生毕业;2000.08-2003.04,任职于中兴通讯股份有限公司,从事管理信息系统开发;2003.10-2007.06,香港浸会大学图像处理与模式识别专业毕业,获得博士学位;2007.07至今,任教于华南师范大学物理与电信工程学院电子工程系,并任电子信息技术研究所副所长,中国人工智能学会青年工作委员会委员, 主要从事模式识别和信号处理等方面的科研工作,尤其是数据挖掘,机器视觉方面的理论和应用研究,在商业智能技术的应用等领域有较深的积累,在数据挖掘、云计算、图像处理等方面有30篇论文发表。自2009年7月以来,先后担任纵横天地电子商旅服务有限公司等多家企业技术顾问,开展数据挖掘和云计算方面校企合作。