一、核心思想
监督学习是机器学习中最直观的学习方式,就像有老师指导的学习过程:
给算法提供”教科书” — 训练数据不仅包含输入信息(如图片),还包含我们期望的正确答案(标签)(如”猫”或”狗”)
学习目标:算法通过学习这些”带标签”的数据,建立一个映射关系 f: X → Y,使其能够对新的、未见过的数据做出准确预测。
二、典型应用场景
应用领域 | 输入 (X) | 输出 (Y) | 业务价值 |
---|---|---|---|
🏠 房价预测 | 房屋特征(面积、位置、房龄) | 价格 | 房产估值、投资决策 |
📧 垃圾邮件检测 | 邮件内容、发件人信息 | 垃圾/正常 | 提升用户体验 |
🖼️ 图像识别 | 图片像素值 | 物体类别 | 自动驾驶、医疗诊断 |
💰 信用评估 | 个人征信信息 | 违约/正常 | 风险控制 |
三、主要问题类型
回归问题 (Regression)
目标:预测连续数值
Cheetsheet入口: 单变量线性回归
分类问题 (Classification)
目标:预测离散类别
Cheetsheet入口: 逻辑回归
四、训练指南
模型训练与优化
了解如何训练、验证和优化监督学习模型