数据降维
课程大纲:多变量统计 - 主成分分析 - 数据降维
第1周:课程介绍与预备知识
- 主题: 多变量统计概览与主成分分析基础
- 学习目标:
- 了解多变量统计的基本概念和应用背景
- 掌握主成分分析的基本原理
- 阅读/资源:
- Stigler, S. (2007). "The History of Statistics: The Measurement of Uncertainty before 1900". Harvard University Press.
- Coursera: Introduction to Multivariate Statistics
- 教学方法: 讲座 + 小组讨论
第2周:主成分分析原理
- 主题: 主成分分析的数学基础
- 学习目标:
- 理解主成分分析的数学公式和计算步骤
- 学习如何进行数据标准化
- 阅读/资源:
- Jolliffe, I.T. (2002). "Principal Component Analysis." Springer Science & Business Media.
- Khan Academy: PCA基础
- 教学方法: 讲座 + 实例演示
第3周:主成分分析实践
- 主题: 使用Python/R进行PCA
- 学习目标:
- 应用PCA在实际数据集上
- 解读PCA结果
- 阅读/资源:
- Scikit-learn文档: PCA
- DataCamp: PCA with Python
- 教学方法: 实践作业 + 小组合作
第4周:数据降维的意义与应用
- 主题: 主成分分析在数据可视化和问题简化中的作用
- 学习目标:
- 了解降维在探索性数据分析中的价值
- 分析降维后的数据对决策的影响
- 阅读/资源:
- Tufte, E.R. (2001). "The Visual Display of Quantitative Information."
- PCA在机器学习中的应用
- 教学方法: 讲座 + 案例研究
第5周:评估与总结
- 主题: 评估与项目
- 学习目标:
- 完成PCA项目,分析并报告结果
- 回顾课程内容,强化关键概念
- 评估方法:
- 项目报告(包括代码实现和分析报告)
- 小组讨论与分享
- 教学方法: 个人演示 + 同行评审
通过这个课程,学生将能够理解和应用主成分分析进行数据降维,同时培养他们的分析技能和批判性思维。