大数据分析与应用研究生课程

课程名称:大数据分析与应用

一、课程编码:

课内学时:32 学分:2

二、适用学科专业: 计算机专业硕士

三、先修课程:

四、教学目标

通过本课程的课堂学习与应用案例,建立科学的大数据观,掌握大数据架构、大数据精准语义搜索、大数据语义分析挖掘、知识图谱等关键技术,熟练使用常用的大数据搜索挖掘与可视化工具,提升大数据的综合应用能力。 

五、教学方式

    课堂学习、研讨班与应用实践

    上课地点: 北京理工大学 8教学楼1001教室, 针对研究生一年级的硕士生

六、主要内容及学时分配

课件:

大数据分析与应用课程说明

第1讲-大数据智能之道法术

第2讲-JZSearch语义精准搜索引擎

第3讲-机器学习与结构化数据挖掘

第4讲 NLPIR大数据语义分析

第5讲 知识图谱关键技术

第6讲 社会化新媒体传播与分析

第7讲 大数据应用实践

2021级 研讨班内容:

组1:深度学习平台

组2:深度学习算法基础

组3:NLP最新进展

组4:语音文字识别与说话人识别

组5:爬虫

组6:多格式文档解析与管理

组7:OCR及领域优化

组8:Image Caption 看图说话

组9:语言预训练模型与应用

组10:汉语分词与标注

组11:语法分析

组12:情感分析

组13:藏语NLP

组14:机器翻译

组15:新词发现

组16:关键词提取

组17:专用命名实体抽取

组18:个人隐私保护与脱敏

组19:计算机图像实体检测

组20:文本分类

组21:文本聚类

组22:话题发现

组23:文本校对

组24:知识图谱构建

组25:社交网络搜索与挖掘

2020级 研讨班内容:

经典深度学习平台:TensorFlow

经典机器学习算法

经典深度学习算法

终身学习1

终身学习2

网络爬虫采集

OCR

预训练语言模型

汉语分词

句法分析

情感分析——1

新词发现

关键词提取

信息过滤与脱敏

文本分类

文本聚类

话题发现

文本相似度比对

知识图谱——1

社交网络搜索与挖掘——1

图文转换

多模态分析

2019级 研讨班内容:

TensorFlow平台及其应用

PyTorch平台及其应用

机器学习经典算法(1)

机器学习经典算法(2)

深度学习经典算法

网络爬虫采集

OCR

语音识别

数据融合及挖掘

多文档解析

BERT

汉语分词

句法分析

情感分析

新词发现

关键词提取

命名实体抽取

信息过滤与脱敏

文本分类

文本聚类

话题发现

文本相似度比对

垂直搜索

知识图谱构建与推理

看图说话

自动配图

机器翻译

社交网络分析

 

2018级 研讨班内容:

深度学习:10月11日  A组  B组

大数据平台架构:10月18日  A组  B组

汉语分词:10月25日  A组  B组

文本分类与聚类:11月1日  A组  11月8日  B组

情感分析:11月8日 A组  11月15日  B组

热点话题发现:11月15日  A组  11月22日  B组

不良信息发现:11月22日  A组  11月29日  B组

短文本分析:12月6日  A组  B组

知识图谱:12月13日  A组  12月20日  B组

社交网络分析:12月20日  A组  12月27日  B组

2018级 课程大作业(前三组为评优组):

1-陈婉月-杨敏-范德宝-天线宝宝搜索引擎

2-姜庆鸿-刘子宇-刘宏玉-基于Seq2Seq的深度学习文本自动摘要

3-王朝阳-刘兆友-古文本自动句读

4-杨可-韩东成-马宇林-大数据纵览ofo共享单车的兴亡史

5-朱远武-金瑞-秦博文-GNMT机器翻译模型实现与分析

6-刘俊艳-利用机器学习神经网络模型结合高斯描述器计算Pt的基态

7- 白璠-牟鑫-吕光奥-基于LSTM的影评感情倾向分析系统

8-张心阳-任建国-巩卫参-圣经问答QA

9-余维航-柯楚雯-郑泉斌-基于微博的情感分析方法对比

10-郭学良-胡光怡-基于Attention机制的BiLSTM新闻主题分类

11-康驻关-赵晋锋-戴云鹏-葫芦娃兄弟电影速推系统

12-王琴瑶-王柯云-马冰-基于CNN的电影评论情感分析

13-喻云飞-唐宋古诗数据集处理及诗人风格分析

14-冯超群-姜欣雨-会吐槽的对话机器人——Teasing-Chat-bot

15-赵堃宇-李欣悦-刘影-基于用户协同过滤的歌单推荐系统

16-谷睿-杨晓雅-恶意代码检测

17-张宗毓-滕博文-张海波-告台湾同胞书智能分析

18-杨晓雷-刘江涛-赵鹏飞-唐家三少网络小说套路分析

19-陈凌-蔡静轩-钱云冲-推荐与预测分析小程序

20-陈潇雅-吉梦瑶-乔婷婷-基于文本挖掘的中国古诗词分析

21-刘思杰-古仁华-刘向昆-基于文件卷积神经网络的电影推荐算法

22-王梦圆-汪安平-惠宁-基于Char-RNN模型的诗歌自动生成系统

23-王宇-梁仁杰-李志文-热点事件挖掘与可视化分析系统

24-徐元超-杨洋-仲泰乐-滴滴出行数据分析对比:成都VS西安

25-周月阳-熊啸楠-钟豪-基于hadoop的蛋白亚细胞区间检索系统

2016级、2017级课件与小组展示 PPT 下载地址:  https://github.com/Dr-Kevin-Zhang/Big-Data-Analysis-and-Application-Course/ 

七、考核与成绩评定

平时研讨,期终大作业加综述答辩考核

八、参考书及学生必读参考资料

1. 张华平,高凯,黄河燕,赵燕平.大数据搜索与挖掘[M].北京:科学出版社,2014.5ISBN:978-7-03-040318-6

九、大纲撰写人:张华平

You May Also Like

About the Author: nlpir

发表回复