各位同学:
为了丰富同学们返校期间的学习生活,统计学院各教学系将自8月31日起连续4天开展“‘计远堂’——统院开学第一周”活动,活动每日上午、下午各一场,主题围绕专业学习、学科竞赛、社会实践等方面以讲座或漫谈形式展开,并由各教学系教师主持、主讲,欢迎同学们积极参与。活动将采用“腾讯会议”软件,因上线数量不得超过300人,故请同学们准时进入会议室,人满即止。9月3日活动信息如下:
一、上午场
时 间:9:00(请于5:50之前入会)
会议号:735-269-708
主题一:在线社交网络用户行为分析与应用:从个人行为到社会预测
周振坤,数据科学系讲师,北京航空航天大学计算机博士,纽约城市大学联合培养博士。研究方向:社交网络用户在线行为量化、分析与建模。
在线社交网络是人们获取信息、传递消息、交友和娱乐等重要渠道,通过一系列机器学习和网络测量等方法量化和计算用户行为,理解和总结在线用户行为规律,并将用户行为应用于社会预测,系统研究用户在个体、关系及社会不同层面的行为规律,为在线社交网络个体心理、用户关系及社会、经济预测的研究提供理论依据和应用指导。
主题二:异常分布数据处理之不平衡数据
李琳,数据科学系讲师,中南财经政法大学数量经济学博士。研究方向:复杂网络、大数据分析与经济金融领域的交叉研究。
异常分布数据处理是数据预处理过程中重要的一环,包括对低频分类数据、高偏度数据、异常值,以及不平衡数据的处理。本次讲座着重介绍不平衡数据处理,包括不平衡数据的含义、不平衡数据对模型的不利影响,以及常用的不平衡数据处理方法。
主题三:大数据中的最优子抽样
邹家辉,数据科学系讲师,中国科学院数学与系统科学研究院博士。研究方向:模型平均,集成学习,最优子抽样。
由于计算和储存设备的限制,在实际中求解基于大数据的统计模型是非常耗时甚至是不可能的。统计学家提出的一种解决方案是希望通过提取大数据中最具有信息的样本点来构造出一个小样本数据,该小样本既要尽可能多地保留信息,又要能够快速计算。本报告将简单介绍统计学家在设计最优子抽样算法时需要面对的困难以及现有的进展。
二、下午场
时 间:14:00(请于13:50之前入会)
会议号:698 442 117
主题一:AI计算机视觉
李晓晴,数据科学系讲师,主要研究领域为图像检索,神经网络和机器学习。
计算机视觉(Computer Vision,简称CV)是人工智能领域的一个重要分支。它是指让计算机和系统能够从图像、视频和其他视觉输入中获取有意义的信息,并根据该信息采取行动或提供建议。本报告将简要介绍计算机视觉的基本概念、实现原理、主要挑战和生活中常见的应用场景等。
主题二:正态分布的前世今生
李秋雅,数据科学系讲师,2021年毕业于香港城市大学商学院。研究方向:统计建模在市场调查、生物医学等领域的方法与应用研究。
我们在实践中大量使用正态分布,却对这一分布的来龙去脉知之甚少,正态分布给人以一种既熟悉又陌生的感觉。优美的正态曲线从发现到被人们重视进而广泛应用,经历了几百年的历史,我们将通过一系列故事,揭开正态分布的神秘面纱。
三、备注
请同学们将讲座内容记录在《创新创业活动记录手册》或《研究生科研实践手册》中,不便的同学,也可使用“统计学院‘计远堂’学生综合素质讲座活动记录页”(附件)记录,正式开学后,学生工作办公室将统一为同学们进行活动认定。
学生工作办公室、数据科学系
2022年9月2日