第 13 周
tidymodels
讲义
近年来在(大)数据涌现、计算机算力提升以及算法普及等方面因素的共同作用下,机器学习在金融数据分析中得到越来越广泛的重视和应用。本讲课程将围绕 tidymodels 元包及其关键子包(如 rsample、recipes、parsinip、yardstick 等)展开,侧重讲解机器学习的核心流程,力图让同学们对机器学习及其 tidymodels 实现有个整体的认知。内容包括:
R 与机器学习
数据重采样 -> rsample
数据预处理 -> recipes
- 定义菜单
- 准备菜单
- 应用菜单
模型训练 -> parsnip
- 模型设定
- 模型拟合
- 模型预测
模型表现 -> yardstick
- 模型表现:
metrics()
- 模型表现:
*_curve()
- 模型表现:
一个较复杂的案例
- 数据
- 数据重采样 -> rsample 包
- 数据预处理 -> recipes 包
- 拟合模型 -> parsnip 包
- 评估模型表现 -> parsnip 包 + yardstick 包
- 模型调参:手动模式
- 模型调参:workflows + tune
tidymodels 家族
1. 课前准备
由于本讲的内容在 📖 R for Data Science, 2e 一书中基本未涉及,在此不布置课前准备任务。
2. 课堂讲义
3. 随堂练习
⌨️ [未安排随堂练习时间]
4. 课后作业
✍️ 列出进一步精进学习的参考资源清单,并未布置需要提交的课后作业