一、核心思想

无监督学习就是让计算机自己在没有标准答案的情况下发现数据中的结构:

给算法提供”线索” — 训练数据只有输入信息,没有预先设定的标签或正确答案

学习目标:算法需要自己探索数据内部隐藏的结构、模式或分组,发现数据中”自然”存在的相似性、关联性或类别。

二、典型应用场景

应用领域数据类型发现目标业务价值
🛒 客户分群购买行为、偏好数据客户群体精准营销、个性化推荐
🚨 异常检测网络流量、交易记录异常模式欺诈检测、系统监控
📊 数据可视化高维业务数据低维表示决策支持、趋势分析
🛍️ 推荐系统用户行为、商品属性关联规则交叉销售、用户体验
🧬 基因分析基因表达数据基因功能模块疾病研究、药物开发

三、主要问题类型

聚类分析 (Clustering)

目标:将相似的数据点分组

Cheetsheet入口

降维技术 (Dimensionality Reduction)

目标:将高维数据映射到低维空间,保留重要信息

Cheetsheet入口