第 13 周

tidymodels

讲义
发布者

曾永艺

发布日期

2023年12月8日


近年来在(大)数据涌现、计算机算力提升以及算法普及等方面因素的共同作用下,机器学习在金融数据分析中得到越来越广泛的重视和应用。本讲课程将围绕 tidymodels 元包及其关键子包(如 rsample、recipes、parsinip、yardstick 等)展开,侧重讲解机器学习的核心流程,力图让同学们对机器学习及其 tidymodels 实现有个整体的认知。内容包括:

  1. R 与机器学习

  2. 数据重采样 -> rsample

  3. 数据预处理 -> recipes

    • 定义菜单
    • 准备菜单
    • 应用菜单
  4. 模型训练 -> parsnip

    • 模型设定
    • 模型拟合
    • 模型预测
  5. 模型表现 -> yardstick

    • 模型表现:metrics()
    • 模型表现:*_curve()
  6. 一个较复杂的案例

    • 数据
    • 数据重采样 -> rsample 包
    • 数据预处理 -> recipes 包
    • 拟合模型 -> parsnip 包
    • 评估模型表现 -> parsnip 包 + yardstick 包
    • 模型调参:手动模式
    • 模型调参:workflows + tune
  7. tidymodels 家族



1. 课前准备

由于本讲的内容在 📖 R for Data Science, 2e 一书中基本未涉及,在此不布置课前准备任务。

2. 课堂讲义

🖥️ 第9讲 tidymodels机器学习

3. 随堂练习

⌨️ [未安排随堂练习时间]

4. 课后作业

✍️ 列出进一步精进学习的参考资源清单,并未布置需要提交的课后作业