监督学习和非监督学习的区别

    如果我们想要预测的是离散值,例如“好瓜”“坏瓜”,此类学习任务称为“分类”;如果想要预测的是连续值,例如西瓜成熟度0.95、0.37,此类学习任务称为“回归”。

    学得模型后,使用其进行预测的过程称为“测试”,被预测的样本成为“测试样本”。例如在学得f后,对测试例x,可得到其预测标记y=f(x)。

    我们还可以对西瓜做“聚类”,即将训练集中的西瓜分为若干组,每组称为一个“”;这些自动形成的簇可能对应一些潜在的概念划分,例如“浅色瓜”“深色瓜”,甚至“本地瓜”“外地瓜”。这样的学习过程有助于我们了解数据内在的规律,能为更深入地分析数据简历基础。需说明的是,在聚类学习中,“浅色瓜”“本地瓜”这样的概念我们事先是不知道的,而且学习过程中使用的训练样本通常不拥有标记信息。

    根据训练数据是否拥有标记信息,学习任务可大致分为两大类:“监督学习”和“非监督学习”,分类和回归是前者的代表,而聚类是后者的代表。再解释一下,监督学习其实就是我们对输入样本经过模型训练后有明确的预期输出,非监督学习就是我们对输入样本经过模型训练后得到什么输出完全没有预期。结合西瓜的例子,监督学习就是我们知道经过模型训练后会分为好瓜或者坏瓜,而非监督学习则会将西瓜聚类为几种我们之前没有明确定义的瓜,如“浅色瓜”“外地瓜”。

    这样结合西瓜的例子解释后,相信你能对经常听到的监督学习和非监督学习两个概念有了比较清晰的了解。


已标记关键词 清除标记
©️2020 CSDN 皮肤主题: 数字20 设计师:CSDN官方博客 返回首页