2025年6月5日晚,中国人民大学吴玉章青年学者、副教授、博士生导师王菲菲应统计学院金融-环境-经济统计科研团队邀请,通过线上方式为统计学院师生带来题为“文本数据分析及其在商业领域的应用”的学术报告。本次报告由统计学院经济统计系主任王陆雅主持。
报告中,王菲菲首先系统介绍了将非结构化的文本数据转化为结构化数据的三种常用方法:向量空间模型、词向量和主题模型。她具体阐释了三种方法的原理,并通过对比介绍了三者各自的特点。在此基础上,她进一步聚焦主题模型,详细阐述了其思路及优势,并以投骰子为例,生动形象地描述了LDA模型的基本原理。接下来,王菲菲结合用户续费预测、企业创新测度、客户评论挖掘的实际问题,分享了主题模型及其拓展模型在经济、管理等领域应用的最新研究成果。报告最后,她还对主题模型与多模态数据融合的未来研究方向进行了介绍和展望。
在互动环节,参会师生围绕模型效果与评价、在企业创新中的应用等问题与王菲菲老师展开了讨论。此次学术报告不仅为学院师生带来了文本数据分析领域的前沿知识与创新应用,也为进一步开展统计学与经济、金融、管理等领域的交叉研究提供了新的思路和启发。