set
(1)计算中的set中每一个点与Xt的距离
(2)按距离增序排列
(3)选择距离最小的前k个点
(4)确定前k个点所在的类别的出现频率
(5)返回频率最高的类别作为测试的结果
数据格式:[frefliermilesearnedperyear]'\t'[peroftimespentplayingvideogames]'\t'[litersoficecreamconsumedperyear]'\t'[1,meansdonotatall/2,meanssmalldo/3,meanslargedo]
由于特征值的大小不同,所以就会对结果的影响程度不同。这就需要我们归一化特征值,把每个特征值的大小固定在[0,1]:
range=MaxVal-MinVal
normVal=rawVal/(MaxVal-MinVal)
1#归一化特征值2defautoNorm(dataSet):3minVals=dataSet.min(0)4maxVals=dataSet.max(0)5ranges=maxVals-minVals6normDataSet=zeros(shape(dataSet))7m=dataSet.shape[0]8normDataSet=dataSet-tile(minVals,(m,1))9normDataSet=normDataSet/tile(ranges,(m,1))10returnnormDataSet,ranges,minVals
THE END