跳转至

ch1 绪论

1. 机器学习的应用背景

  • 数据挖掘:借助历史数据帮助我们提升决策
    • 商业智能:超市货架上物品的摆放位置
    • 信用风险分析
  • 个性化程序
    • 垃圾邮件过滤
    • 学习用户习惯
    • 电子商务推荐、社交网络推荐
  • 人无法做或不想做的事
    • 模式识别:人脸识别、语音识别、手写识别
    • 自动驾驶
    • 搜索引擎:信息检索中的排名

2. 什么是机器学习

学习是系统的一种变化,使得之后做同样任务时更高效。

学习是构建或修改正在经历的事物的表征。

学习是在某项任务中积累经验以改进。

核心要素:任务(Task),经验(Experience),性能(Performance)

关键词:改变,构建或修改,改进

  • 学习下棋
    • T:下棋
    • P:胜率
    • E:与自己对弈,与大师对弈等
  • 手写识别
    • T:识别符号
    • P:识别准确率
    • E:找大量的手写字进行识别训练

3. 机器学习系统设计

设计步骤:

  1. 用什么经验数据?训练数据能否代表性能目标?要注意数据偏差,比如数据完整性,训练过程,特征选择。

  2. 学什么?最终目标还是近似目标?

  3. 如何表示?表示的精度和所需代价之间的平衡?

  4. 用什么算法进行学习?
  5. 如何评价学习结果?