大数据导论与实践

(张振)MA2342024春  
2024春
8.0(2人评价)
  • 课程难度
    中等
  • 作业多少
    中等
  • 给分好坏
    一般
  • 收获大小
    很多
选课类别:专业任务 教学语言:双语
课程类别:专业选修课 开课单位:数学系
课程层次:未知 获得学分:4.0
课程主页:暂无(如果你知道,请点右上角“编辑课程信息”添加!)
课程简介(教工部数据)
本课程面向对于工业数学和大数据分析感兴趣的本科生,主要讲授数据科学的数学理论、算法和python编程。课程覆盖python编程导引、数据预处理、分类、回归、聚类、模型选择、降维,以及包括深度学习在内的一些热门前沿内容。


This course is intended for undergraduate students who are interested in pursuing industrial work and research in big data science. It provides a concise and self-contained introduction to mathematical aspect of big data science, including theoretical analysis, algorithms and programming with python. Major topics include introduction to python programming, data preprocessing, classification, regression, clustering, model selection, dimensionality reduction, and hot topics such as neural network and deep learning if time permits.
点评写点评
排序学期
评分评分2条点评
user avatar   LunaQu4kez     2024春
  • 难度:中等
  • 作业:中等
  • 给分:超好
  • 收获:很多

这门课可以对标计系的机器学习,因此也可以称为数学系机器学习 (如果想水选修学分,可以这两个都选,内容重合非常大)  对于数学系来说应该不是太困难,对计系可能需要一些数学功底

总体体验本身还行,不能说非常好,但起码比计系那个机器学习要好;老师讲课中规中矩,但是人很好,有 Quiz 会提前在课程群里说,不会突击;作业不多,但是有一些难度;作为数学系课程,Project 比计系的要好办;没有期中考试,最后期末考试是最值得吐槽的地方 (见下);给分上,我最后拿了 A,但总体给分也许不那么好

细说每个部分:

  • 作业 30 分:共 5 次,难度不小,全是计算或证明的大题,但是貌似基本祖传,可以看上一届的作业
  • Quiz 15 分:共 6 次,开卷可以看 ppt 和上网查,难度比作业小很多,但有选择和判断,考察对细节的掌握,不过好消息是 Quiz 的很多题目也祖传,可以参考上一届的
  • Project 20 分:1 - 2 人做一个数据分析的 Project,难度不大,可卷可摆,没有非常明确的评分标准但给分都挺好的
  • 期末考试 35 分:期末由判断题,选择题,简答题,大题组成,难度介于 Quiz 和作业之间。考法有一点怪,比较常规和基础的东西出小题,比较偏的知识点比如某算法的某一个变种反而出大题,可能大家考的都不怎么样,因为听到老师吐槽期末考的明明也不难怎么那么多不及格的,但最后也没捞。值得注意的是,大题会出作业原题要仔细复习。

最后是资料分享:

大数据导论课程资料:链接

我们组的 Project 可参考:链接

数学系课程资料仓库:链接

user avatar   水都的拉帝欧斯     2024春
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:很多

欸 这门课怎么也没人来评价……

如果你是计算机系的学生,那么我不建议你来选这门课程。

先讲一讲课程内容吧。这门课其实就是机器学习。机器学习其实就是给定一个数据集,有各种各样的方法去找到这个数据集内在的一些规律。比如说给定一个用户是否点击广告的数据集,里面有各种用户信息,以及他是否点击了广告。我们可以通过这个数据集训练一个模型去预测一个用户会不会点广告(没错这就是这个学期的其中一个project)。

课程内容还是比较硬的。数学味很重,课程中的有很大的比例都是在黑板上进行推导。而且这门课程涉及很多线性代数和概率论的内容。请注意,如果脑子里只剩下了概统和快忘光了的线代知识的话,是不足以听懂这门课的。

接下来讲讲分数吧:

15%的quiz,这个学期考了六次quiz,总体难度并不大,并且给分比较水,而且是开卷和open Internet.

30%的作业。作业比较难,作业有五次,作为计算机系的学生,没有ChatGPT根本写不出来作业。

20%的project。作为计算机系的学生,project比较水,使用python语言。可以1-2人组队。虽然课程会讲解机器学习这些算法的基本原理,但是project只管调库就行了。

35%的期末考试。期末考试是作业题精选集。总体来说不难,只要平时作业都弄懂了的话不会太头疼。但是需要注意考试也并不完全是作业题精选集,也有一些大题是作业题中没有的。

本寄系鼠鼠拿了一个A-,对于这门不太听得懂的课程来说也还算比较满意了


其他老师的「大数据导论与实践」课

张振老师的其他课