文本分析及机器学习在影视传媒中的应用——以电视剧《狂飙》为例

扬科启航 35170

        影视剧《狂飙》于2023年1月14日在CCTV-8与网络平台爱奇艺同步播出。该剧自播出以来,引发了全民现象级讨论,成为2023年度首部爆款剧作。《狂飙》以两条故事线为叙事线索,其一为小人物高启强逐步成为黑社会头目的“发家史”;其二为以安欣为代表的政法系统干部与黑恶势力长达二十年的“斗争史”。该剧通过“三幕式”时空交错的叙事手法、精彩且充满悬念的故事情节以及鲜活生动具备“反差萌”的人物性格,赢得了观众的一致好评。在艺术层面上取得成功的同时,在价值传播上也获得了观众的认可。截至2023年4月10日,《狂飙》在豆瓣网收获8.5分的高分,有77万余名观众对该剧进行评分,其中有25万余人发表观点参与讨论。可见,将《狂飙》作为研究对象,可以很好的探究“顶流热剧”何以生成与建构,溯源其“走红”内在肌理、必备要素与发生机制,为今后的影视剧创作具有重要的借鉴意义。本文以豆瓣网为数据库,通过Python工具对《狂飙》豆瓣网长评进行数据抓取,利用文本分析与机器学习的技术,从观众回馈角度使用定量方法对《狂飙》进行深入剖析。

  一、豆瓣长评获取

  (一)豆瓣评论

  豆瓣网号称“文艺青年聚集地”,网站以读书、电影、音乐、同城、小组等核心板块为中心,依靠网友自发分享和评价书籍、影视和音乐作品作为高质量输出内容,具有较强的用户粘性,反映了国内社会一大部分青年的价值取向和文艺追求。其中,豆瓣影视的评分机制赋予大众一人一票的公平投票权利,受商业化渗透程度较低,成为国内影视剧口碑影响力最重要的参考依据之一。豆瓣评论通常包括长评与短评,短评数量庞大,但评价内容较少,信息密度不高,容易被“水军”占领舆论阵地,发生刷分刷负现象,从而产生信息噪音。相比较而言,长评数量虽然明显更少,但长评的细节丰富,对故事情节、角色刻画、逻辑架构的批判与分析更为到位,言之有物的内容充分表达了观众的意识形态和情感需求,因此本文选取豆瓣长评作为文本分析的主要研究对象。

  (二)数据爬取

  利用Python3.8工具爬取豆瓣网关于电视剧《狂飙》的影视长评内容,具体步骤包括三步:(1)获取长评内容网址链接,分析网站结构;(2)导入requests、BeautifulSoup等第三方库,通过编写代码发送请求并返回响应,并使用正则表达进行内容解析,获得所需数据(核心代码见附录1,结果备索);(3)将爬取数据储存至CSV表格中。

  通过爬虫及数据清洗获得用户昵称、发评时间、长评内容、评分、评论影响(赞同与反对)、评论字数等相关信息,由于存在重复评论和被折叠评论,经删除无效数据后最终共抓取3075条评论,涵盖了97%的总长评数。原始数据结构如下:

  注:以上表格仅展示部分数据,用户昵称从第二个字起用“*”号隐去。

  二、豆瓣长评分析

  (一)长评评分、评论及观众特征

  本文利用Python的第三方库pyecharts对爬取的3 075条评论进行可视化分析,排除657个用户未进行评分,剩下2 418个数据的评价结果如图所示。从图1可以看出,在所有长评数据中,超过一半(52.4%)的观众给出五星好评(力荐),30.2%的豆友给出四星好评(推荐),12.2%的观众给出三星评价(还行),而一星二星观众相对较少,合计仅占所有观众人数的5%左右,该样本统计结果与77万人参与的豆瓣总体评分也较为接近(5星占比41.3%,4星占比44.9%,3星占比12.1%,2星占比1.2%,1星占比0.5%),超过八成的人群认为电视剧《狂飙》值得推荐。

  图1:《狂飙》评分

  值得关注的是,长评观众倾向于更加明显的情绪表露,表现为占比更高的五星好评和一星差评,这种更加激进的情绪输出也驱动他们在评论区花费更多的笔墨表达自己强烈的情感。长评的平均字数为852字,最高字数为16 470字,最低为71字。与之对比的是,我们爬取了一部分短评(521条数据),经统计发现短评平均字数为90字,最高为350字,最低仅有2字。从图2中可以看出,对电视剧《狂飙》评价较高(五星和四星评价)的长评观众不吝赞美,平均评论字数为900-1 000字,明显多于其他评价组。而一星观众稍显“敷衍”,平均评论字数下降到558字。

  图2:《狂飙》长评字数

  《狂飙》共39集,每集45分钟。1月14日首日爱奇艺会员更新5集,除1月21日和22日(农历除夕和初一)停播以外,其余每日于晚间19:30更2集。视频播出前期,日评论数量相对平稳。1月23日,评论有小幅度攀升,日长评超过30条。1月28日,评论数量陡增至88条,到完结日2月1日当天评论数量达到257条。评论热度的峰值出现在《狂飙》完结的第二天,当日长评数量高达330条,之后3天的日评论数量均超过100条,接近一个月后热度下降,在此之后出现了较强的长尾效应(Long Tail Effect)。

  图3:《狂飙》评论热度

  可以看出,上述豆瓣长评热度趋势与百度搜索指数图形(见图4)走向基本保持一致,表明豆瓣长评数据真实地反映了电视剧《狂飙》受市场的追捧力度。《狂飙》在中期突然发力,与1月23日扮演者高启强的演员张颂文突然冲上微博热搜第一密切相关[1]。这也证明了角色与演员之间的互动关系。尽管前期反应平平,但最终优秀的作品不会被市场埋没,特别是在信息传播极度发达的时代,往往只需要等待一个契机,高分好剧就能被市场发掘与认可。

  图4:百度搜索指数(搜索关键词:狂飙)

  图5按照发表长评的时点绘制的趋势图,反映了在不同时段观众发评的活跃度。从发评时间来看,豆瓣观众表现出了“夜猫子”属性,晚上的评论数量明显高于白天,特别是第一集电视剧播出15分钟(19点45分)后,评论逐渐增加,直到夜间23:30后活跃度才慢慢下降。

  图5:《狂飙》观众活跃度

  由于长评未显示IP地址,无法反映评论用户所在地,本文使用短评观众的IP地址近似刻画观众的地理位置。从表2可以看出,北京、上海和广东三地评论用户数量最多,约占总体的32.8%。此外,《狂飙》出现的场景如榕树、牌楼、肠粉、猪脚面、舞狮等粤地场景及文化元素也吸引了不少广东观众的留言。如表2所示,《狂飙》的观众地域分布集中在北上广大城市和江浙地区,一定程度上反映了经济发展与文化繁荣共同促进,但另一方面也让我们进一步思考网络话语权在区域之间的均衡分配的问题。尽管在新媒体时代下,网络话语权在社会格序中重新分配,但如何更公平地“让每一个人发声”也成为新时代下的影视传媒与群众舆论话题下提出了新的挑战。

  (二)长评内容和话题

  本文利用Python读取所有长评,借助哈工大停用词(stopwords)表去除长评中的停用词后,通过第三方库jieba的分词功能对长评进行分词,并按降序排列统计每个词语的词频数,词频统计结果见表2。利用第三方库stylecloud绘制词云图,词云图结果见图6。图6显示观众对角色的讨论次数最多,两大对立主角安欣和高启强是当之无愧的评论中心,词频分布次数分别为12159和12696次,此外,“大嫂/陈书婷”“孟钰”“老默”等剧情关键人物提及频率也相当高,以上人物出现频率均超过1000次。演员方面,讨论热度最高的演员分别是张译(安欣的扮演者)与张颂文(高启强的扮演者),二人在长评中被提及的次数分别为1 508和1 735次。而与主题相关的词语包括“警察”“扫黑”等。此外,评论中有2706次提到“剧情”,1587次提到“演技”,并且“烂尾”的出现频率为256次,这与豆瓣总体评分从巅峰时9.1分跌落至8.5分也可相互印证。我们通过人工阅读了涉及“烂尾”的长评,发现较多观众对27集之后的剧情发展评价较低。

  图6:《狂飙》长评词云图

  (三)长评情感分析

  文本分析的重要领域之一是情感分析。常见的情感分析方法有构建情感词典,如台湾大学NTUSD数据、清华大学李军中文褒贬义词典、Loughran and McDonald词典等都是已有的情感词典,通过累计汇总积极消极词汇对评论情感打分,当出现积极词汇次数越多时,评论情感越积极。上述方法对情感词典的质量要求较高,同时收录在情感词典的词语选择具有一定的主观性。因此,本文拟采用机器学习(Machine Learning)中朴素贝叶斯分类算法,使用TF-IDF词袋法对长评文本进行向量化,并利用MultinomialNB分类器将每一个评论情感分解为消极情绪含量(分类为消极评论的概率)、中性情绪含量(分类为中性评论的概率)、积极情绪含量(分类为积极评论的概率)三类成分,并与长评用户人工打分进行对比。

  通过朴素贝叶斯分类进行情感分类的准确率(Accuracy)接近83%,且该结果具有一定的可靠性。例如,从表4可见,对用户“L***”的评论,贝叶斯算法认为积极情绪含量接近九成,该用户对《狂飙》的评分为4星。而用户“C***”和用户“大***”评论的积极情绪含量相对下降,中性情绪含量明显提升,两人对电视剧的评分为3星。同时由表4可知,与其他组相比,差评组平均消极情绪含量最高(7.22%,4.58%,3.92%),好评组平均积极情绪含量最高(81.04%,77.79%,86.33%),中评组评论的平均中性情绪更加明显(11.74%,17.63%,9.75%)。但是,使用机器学习算法进行自动分类也存在分类准确性问题,特别是长评语境下情感更加复杂,难以明确区分情绪差异。

  三、思考和总结

  以《狂飙》豆瓣长评数据为基础,本文对观众的评分评价、评论文本的观众特征等定量信息做出分析。借助数据来分析影视作品的观众反馈,是对影视剧作品研究的新思路与新方法。得出结论如下:

  首先,打破“非黑即白”的人物形象塑造定式,适当展示人性的灰度,并不会对主流价值观产生巨大冲击,造成正义与邪恶界限上的混淆和模糊。高启强这一立体的人物设计,表达的是“复杂的恶”而非“简单的坏”,这使得角色有了层次感和厚重感。观众旁观角色的心理变化历程,更倾向于“好人变坏是有原因的”,因此对其多了一份理解和同情。这些剧本的设计和人物冲突的处理,无一不是反映了人性的真实和幽微。反派“坏得合理”才能构建流畅的剧情和清晰的逻辑,人物性格的多重性才能引发观众对人性的讨论和反思。《狂飙》中的反派人物高启强最终锒铛入狱,为罪恶付出了惨痛的代价,绝大多数观众表示理解,而非宽宥。从这一点看,影视传媒在树立正确的价值观不仅需要单方面的灌输和传导,类似广泛的、有益的讨论也是必不可少的。

  其次,突破“工具属性”的女性形象定位,跳出家庭伦理与都市情感剧的框架与套路来建构女性角色,更符合当下的市场口味。随着“大女主”电视剧走红,女性意识的觉醒,市场对女性多元化性格展示需求更高。《狂飙》塑造的大嫂的形象精明干练,清醒独立,打破了对女性情绪化特征的偏见。这一角色缓解了观众对单薄女性角色塑造市场下的审美疲劳,正如豆瓣观众在评论中写道:“陈书婷作为‘大嫂’没有依附于剧里任何一个男人而存在,她身上有一种女性独有的狠劲儿。”但仍然有观众表示,这部剧中女性角色的整体塑造仍然存在缺陷,女性角色沦为男性角色的陪衬,故事线延展不足。豆瓣长评有助于把握观众的需求,了解观众的喜好,并鼓励女性角色新设定的尝试和探索,同时也反映了观众对女性刻画的丰满程度提出更高的要求。

  最后,本文通过爬取豆瓣影视的长评数据进行分析,探讨了观众对该剧的讨论情况和情感倾向。分析表明,该剧引起了观众的广泛关注和讨论,尤其在北上广大城市和江浙地区的反响尤为强烈,即使在该剧收官后仍有不小热度。长评评论中观众对角色的讨论占据了很大比例,演员和主题相关的讨论也是热门话题,同时本剧也受到了观众的一定批评。采用朴素贝叶斯分类算法的情感分析结果与豆瓣影视评分相符,对差评、中评、好评组的消极、中性、积极情绪含量进行纵向对比展现出显著差异。但由于长评语境下情感更加复杂,机器学习算法进行自动分类也难以明确区分情绪差异,也可能存在分类准确性问题。本文的研究方法可以为其他电视剧的讨论和评价提供借鉴,为进一步了解观众对电视剧的认知和评价提供了一定的参考依据。

  作者:邓瑶,江西财经大学会计学院2020级博士研究生;荣莉,江西财经大学会计学院博士研究生导师;毕蕾,江西财经大学马克思主义学院2020级博士研究生。




文本分析及机器学习在影视传媒中的应用——以电视剧《狂飙》为例


    免责声明:本文系转载自网络,发布本文为传递更多信息之用,另:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实, 对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。投资理财需谨慎,切勿轻信投资承诺,本站与任何网上投资行为无关。