行业资讯

聚量观察 | 情感分析能有什么坏心思,无非是想更懂你罢了

2021.05.28

本期看点 ① 从字里行间,每一次都想更懂你

② 人类的情感虽不相通,但情感分析大有用途

③ 万千文本舆情数据中,发现潜在风险


由于关注到论坛上爆出相关公司拖欠工资问题,有金融机构成功避开一次债务违约事件。


在去年的一起广受关注的债务违约事件中,多家金融机构踩雷。事件发生后,有金融机构的风控人士表示,此前对该项目拒过两次,最直接的原因就是在相关论坛上发现了该公司拖欠工资的问题,这引起了风控人士的警觉。


这不禁令人心生感叹。论坛上的言论,竟然帮助金融机构避开了雷区,足见进行文本舆情分析的重要性;同时,不是所有的金融机构都关注到并重视了这些言论,由此可见文本舆情分析的艰难。


一家企业作为市场主体,会有许多相关文本舆情信息出现。但是,文本舆情数据海量,且散落在各处,纯粹依靠人工搜集和分析,显然成本高、效率低、及时性不够、准确率不能有保证,如何取舍是个问题,且难免有疏漏。这时就需要用到情感分析(sentiment analysis)。


从字里行间,每一次都想更懂你


此处的情感分析,不是午夜时分电台情感分析节目,而是属于自然语言处理(NLP, natural language processing)的范畴,但却可能比情感节目更懂你。情感分析,又被称为意见挖掘(opinion mining)或情感人工智能(emotion AI),运用自然语言处理、文本挖掘、计算机语言学、生物特征识别等方法,系统性识别和提取文本中的情感状态和主观信息。


对文本进行情感分析,涉及到数据获取和数据处理。首先,要有数据来源,如新闻平台、电商平台、社交平台等,这些地方汇集了海量的数据;接着,要在这些平台上找到原始数据,包括但不限于用户评论、用户反馈等;有了原始数据,各种数据鱼龙混杂,还需要通过文本清洗、数据去重等操作进行数据预处理;此后,才能进行文本分析,包括词频分析、情感分析,这样完成情感分析工作,用于反馈工作和指导实践。



在对数据加以处理后,情感分析的结果可以根据具体情况和需求用相应方式呈现出来,可以是文本、情绪词频统计图、雷达图、词(字)云图、情感趋势图等,以直观的形式展示给用户,一目了然掌握情况。


正面标题词云(左)与负面标题词云(右)


情绪词频统计图


人类的情感虽不相通,但情感分析大有用途


金杯银杯,不如老百姓的口碑。对文本舆情数据进行情感分析,可以发掘和发现人们对于某话题、政策、企业、人物、事件等的观点和态度,是肯定和积极,还是否定和消极,抑或是中性和中立。


当前,情感分析已经广泛应用到新闻舆论监控、制造业、购物平台、影评平台、旅游平台、社交平台等,通过分析相关平台上的评论,进行定性和定量分析,为决策提供依据。有了情感分析的加持,不用投入巨大的人力物力财力,不用把一条条评论和一篇篇文章全部看完,就可以全面、直观、准确、快速地掌握整体的反馈情况。比如,对于管理部门而言,可以对舆情进行分析,把握社情民意;对于企业和商家而言,可以掌握用户对产品和服务的体验评价,有针对性地提升产品和服务质量;对于消费者而言,即便产品没用过、美食没吃过、电影没看过,也可以直接、快速获取有用信息。


由于能在海量数据中发现特定主体的文本舆情信息,情感分析领域发展迅速。当前,在情感分析方面做得好的企业,有阿里、百度、腾讯、华为、网易、达观数据等。


情感分析既是自然语言处理的重要发展方向,也是深度学习的重要应用领域。一方面,这些年来,深度学习随着自身的成熟和优化,日益被广泛地应用到情感分析。包括多层神经网络(MLP)、前馈神经网络(FNN)、Word2Vec、卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)等在内的情感分析中常见的基本模型,在提高情感分析准确度方面发挥了重要作用。另一方面,机器语言不同于人类语言,机器理解人类语言和情感的能力是情感分析领域发展的主要挑战,需要进一步完善和提升。


万千文本舆情数据中,发现潜在风险


信息不对称,既是金融服务的一大特点,也是亟需完善的不足之处。一家企业相关的信息流等文本舆情数据,能够在一定程度上从不同侧面反映出企业的经营情况,可以用于丰富对相关企业的认知。在产业数字金融的理论探索和创新实践中,针对信息流等文本舆情数据的发掘,就运用到了情感分析等技术。


产业数字金融通过物流、商流、资金流和信息流构建交易信用风控模型。其中,信息流是“四流合一”的数据重要组成部分,对信息流的掌握有助于全面掌握企业实际情况。情感分析应用于产业数字金融,对企业信息流进行分析,数据来源包括新闻报道、司法文书、社交媒体等,综合运用各种深度学习算法,并与其他人工智能技术相结合,不仅可以读懂文本,对已有数据进行分析,发现企业当前情况,更重要的是,还能通过既往数据对未来趋势进行预测,对潜在风险进行预警,及时发现和有效防范风险,降低金融机构进行产业金融服务的风险。



有了情感分析,产业数字金融可以掌握相关企业情况,发现负面舆情,在第一时间将相关舆情和预警信息精准推送给金融机构,在贷前、贷时和贷后阶段供决策参考。



借助于情感分析,产业数字金融在信息流维度上,力争从不同渠道、多个方面掌握企业情况,与物流、商流、资金流数据一起,构成企业状况全面、立体、真实的图景,帮助金融机构掌握实体企业情况,帮助实体企业获得产业金融服务。


参考文献:

[1]东莞证券:《股吧里说了什么?——基于文本舆情构建股市情绪指标》

[2]华泰证券:《舆情因子和BERT情感分类模型》

[3]机器之心:《就喜欢看综述论文:情感分析中的深度学习》

[4]Persistence Market Research:sentiment analysis software market:global industry trend analysis 2012 to 2017 and forecast 2017 – 2025

[5]Pang and Lee:opinion mining and sentiment analysis

[6]Wilson, Wiebe and Hoffmann:recognizing contextual polarity in phrase-level sentiment analysis

[7]Express Journal:sentiment analysis software market size, detail analysis for business development, top companies 2026

[8]https://hai.stanford.edu/blog/can-artificial-intelligence-map-our-moods


文章作者: 李万林 陆昕卉(聚均科技综合管理部)

图片编制:  曹  蕾(聚量集团办公室)

总 策 划:  乔嘉男(聚量集团办公室)

上一篇:聚量观察 | 视而不见:这项技术能不能让你安心分享数据...

下一篇:聚量观察 | 面对海量数据,谁是抽丝剥茧的侦探

←返回列表