帖子

day19学习笔记8/1

[复制链接]
  • TA的每日心情
    开心
    2020-7-16 09:47
  • 签到天数: 1 天

    [LV.1]初来乍到

    1760 189****8161 发表于 2020-8-1 15:28:30 1#
    K最近邻(k-Nearest NeighborKNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:在特征空间中,如果一个样本附近的k个最近(即特征空间中最邻近)样本的大多数属于某一个类别,则该样本也属于这个类别。
    我们常说,物以类聚,人以群分,要判断样本属于哪一类数据从它的邻居下手。所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。K 值的选择,距离度量和分类决策规则是该算法的三个基本要素:1K 值的选择会对算法的结果产生重大影响。2,分类决策规则往往是多数表决
    3,距离度量一般采用 Lp 距离,当p=2时,即为欧氏距离。
    KNN算法不仅可以用于分类,还可以用于回归。通过找出一个样本的k个最近邻居,将这些邻居的属性的平均值赋给该样本,就可以得到该样本的属性