数据科学与大数据创新实验室位于主楼11层11093室,建筑面积95平方米,无形资产69.94万元,包括数据科学综合项目实验实训平台、大数据实验教学系统的模块资源等。
实验室承担数据科学与大数据专业专业一、二、三、四年级300余名学生的实验教学任务,同时向全系学生开放,年均实验教学任务约5千学生人时数。
本实验室开设的课程包括《Java高级程序设计及应用实验》、《数据库原理及应用》、《数据挖掘技术与应用》、《web开发技术》、《专业实习(海量数据挖掘与可视化实战)》等。
主要开设的实验项目有:
序号 |
课程名称 |
实验项目名称 |
实验类型 |
学时 |
1 |
Java高级程序设计及应用实验 |
学生信息管理 |
综合性 |
3 |
电影院售票和实现多用户共享账户取款(同步) |
综合性 |
2 |
实现聊天室 |
综合性 |
3 |
2 |
数据库原理及应用 |
商品数据库管理系统的设计和查询操作 |
设计性 |
8 |
3 |
数据导入与预处理 |
Flume与Kafka的安装部署 |
综合性 |
2 |
Flume采集Nginx服务器日志实验 |
综合性 |
2 |
Flume实时读取本地文件到HDFS实验 |
综合性 |
2 |
Flume与Kafka整合监控目录文件实验 |
综合性 |
2 |
4 |
数据挖掘技术与应用 |
电商用户购买行为分析 |
综合性 |
4 |
垃圾邮件的检测 |
综合性 |
4 |
5 |
web开发技术 |
关于studeon网站的设计与开发 |
综合性 |
8 |
6 |
专业实习(海量数据挖掘与可视化实战) |
商城用户行为分析可视化大屏制作 |
综合性 |
1周 |
7 |
运筹学 |
线性规划模型Lingo求解 |
综合性 |
2 |
整数规划模型Lingo求解 |
综合性 |
2 |
运输问题模型Lingo求解 |
综合性 |
2 |
最短路问题模型Lingo求解 |
综合性 |
2 |
8 |
大数据高级应用开发 |
Spark集群搭建与计算 |
综合性 |
4 |
Spark SQL操作MySQL数据源 |
综合性 |
4 |
主要实验项目简介:
具有代表性的实验名称有:“基于Java语言实现学生信息管理”、“垃圾邮件检测算法”、“关于studeon网站的设计与开发”、“商城用户行为分析可视化大屏制作”等。
(1)基于Java语言实现学生信息管理:完成学生信息增删改查功能,训练编程思维,提高动手能力和解决问题能力。
(2)垃圾邮件检测算法:基于朴素贝叶斯算法实现垃圾邮件的检测,通过观察垃圾邮件和正常邮件中出现单词的频率来进行分类。通过训练模型,找到一种高效且准确的垃圾邮件检测方法。
(3)Flume与Kafka整合监控目录文件实验:完成Flume与Kafka的对接整合,要求对运行Hadoop平台集群有一定了解,能够通过集群同步所有文件夹,对指定目录进行Flume的监控,最终成功发送给Kafka进行处理
(4)关于studeon网站的设计与开发:主要基于HTML、CSS样式和JavaScript基本编程、对象与事件处理机制进行网站整体规划与相关网页设计。通过设计实验训练,让学生充分掌握HTML网页结构和CSS样式表设计,利用JavaScript处理相关事件,进一步培养学生勇于创新与实事求是的精神。
(5)商场用户行为可视化大屏制作:基于商城用户行为数据集,实现数据采集、数据存储、数据计算、数据可视化展示的完整流程,还原真实企业应用环境下的大数据可视化应用。
(6)线性规划模型Lingo求解:编写简单的线性规划模型lingo代码对理论课程中的案例所建立的模型进行求解
(7)Spark集群搭建与计算:spark集群的安装与配置,进行spark集群环境测试和spark scala编程交互式测试,最终进行spark jar包综合测试