首都经济贸易大学统计学院

统计学院成功举办第一期软件与数据挖掘算法讨论班

发文单位：发文时间：2017-12-08

　　2017年12月6日晚，第一期软件与数据挖掘算法（以下简称“SDA”）讨论班第一次课程正式开始授课。SDA讨论班由首都经济贸易大学（以下简称“首经贸”）统计学院研究生会主办，以统计学院为依托，针对国际前沿数据挖掘算法、文本挖掘、统计学习、深度学习、人工智能等热门领域，面向首经贸热爱数据挖掘、对各种分析技术有较高需求的全体师生而开办。

　　SDA讨论班第一期以网络爬虫技术为主题。在大型互联网公司，由于产品的性质易于获取大量信息流，因此获取需要的数据相对容易，而一些小型互联网公司，以及其他行业的公司企业，其产品并可能并不会自动截取信息，但在大数据时代，所有行业必须参加进来，需要想办法获取数据。网络爬虫技术由此应运而生。

　　本次讨论班我们荣幸的邀请到了研二大数据专业硕士王禹学长作为主讲人。讨论班正式开始前，统计学院研究生会主席苏铎同学为大家的到来与支持表示了感谢，并对大家今后在讨论班中的学习提出了希冀。课程正式开始，王禹学长首先简单介绍了几种主流的爬虫手段，包括静态的HTML爬取以及动态的json爬取。在讲解的过程中，王禹学长准备了他在学术研究以及实习中遇到的两个案例，充分解释了前面的两种方法以及代码实现。在最后的提问环节，王禹学长根据同学的问题向大家介绍了Python与数据库连接的端口，完善了整节课程的学习体系。本次讨论班共有10名同学参加，他们都收获良多。

　　此外，特别感谢统计学院田瑜老师与袁晶老师的鼓励与支持，使讨论班的顺利开展得以保障！