kNN算法及案例分析zhangX

K最近邻,顾名思义,就是K个最邻近的样本的意思。如果一个样本的最接近的K个邻居里,绝大多数属于某个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。KNN算法有两个关键点要注意。第一个关键点是K的确定,选择一个最佳的K值取决于数据分布情况。总的来说,较小的K值能使模型更不容易受样本不均衡的影响,而较大的K值能够减小噪声的影响。第二个关键点是最近邻的定义,也就是距离定义,常用的有欧式距离、余弦距离等,具体采用哪种距离定义要根据实际的数据和业务确定。由于KNN在确定分类决策上只依据最邻近的几个样本的类别来决定待分样本所属的类别,它只与极少量的相邻样本有关,因此它是非线性的,对于类域的交叉或重叠较多的待分样本集来说,KNN方法非常适用。

#选择iris数据集为例,iris共有150条1数据

#对iris进行归一化处理,scale归一化的公式为(x-mean(x))/sqrt(var(x))

iris_s=data.frame(scale(iris[,1:4]))iris_s<-cbind(iris_s,iris[,5])#对iris数据集随机选择其中的前100条数据作为已知分类的样本集(训练集)

sample.list<-sample(1:150,size=100)iris.known<-iris_s[sample.list,]#剩余50条数据作为位置分类的样本集(测试集)

iris.unknown<-iris_s[-sample.list,]#对测试集中的每个样本计算其与已知样本的距离,因为已经归一化,此处直接使用欧氏距离

案例1:股票市场数据的应用

#K=1时的结果不理想,只有50%的观测得到正确的预测,这可能因为K=1的模型过于光滑,使用K=3重复上述实验。

案例2:大篷车保险数据的一个应用

对ISLR库中的Caravan(大篷车)数据集运用KNN方法。该数据集包括85个预测变量,测量了5822人的人口特征。响应变最为Purchase(购买状态).表示一个人是否会购买大篷车保险险种。在该数据集中,只有6%的人购买了大篷车保险。

结果分析:事实表明K=1在被预测有购买倾向性的客户上KNN模型比随机预测效果好得多,77名这样的客户,其中9名,也就是11.7%事实上购买了保险。这个结果的概率是随机猜测得到结果概率的两倍。

结果分析:K=3时,成功率增加至19%,而当K=5时,成功率变为26.7%,这比随机猜想所得成功率的四倍还多。这似乎表明KNN在一个复杂数据集中可以发现一些真实的模式。

#案例3:鸢尾花数据集

library("class")train.idx<-sample(1:nrow(iris),100)iris.train<-iris[train.idx,]iris.test<-iris[-train.idx,]resknn<-knn(train=subset(iris.train,select=-Species),test=subset(iris.test,select=-Species),cl=iris.train$Species,k=2)table(iris.test$Species,resknn,dnn=c("Actual","predicted"))

THE END
1.车辆损失险,什么是车辆损失险?车辆损失险理赔问题咨询4008要真正的了解并掌握车辆损失险是...详情>> 车辆损失险计算公式是什么? 现如今随着有车一族越来越多,车主对汽车也是越来越重视,但是即便再小心,也难免磕磕碰碰,这是绝大多数车主选择车辆损失险的重要原因。然而作为最基本的汽车商业保险险种,车辆损失险计算公式是什么呢?...详情>>...http://chexian.pingan.com/zhuanti/cheliangsunshixian.shtml
2.轮胎外径尺寸计算方法是什么?轮胎的外径D的计算公式为:D=轮毂的直径+轮胎宽度×扁平比×2。以下是相关介绍:1、轮胎:轮胎是汽车的重要部件,在汽车轮胎上的标记有10余种,正确识别这些标记对轮胎的选配、使用、保养十分重要,对于保障行车安全和延长轮胎使用寿命具有重要意义。2、轮胎规格表示方法:轮胎规格表示方法有三种:A公制(m);B公制混合;C英...https://3g.china.com/auto/mip/760184.html
1.汽车保险费的计算公式是什么【摘要】一般的汽车需要买的车险包括强制保险、第三者责任险、车辆损失险、全车盗抢险等,那如何计算汽车保险费用?交强险的车险价格一般都是根据车型和用途进行定价,而商业车险的价格有具体的计算公式。想要了解更多关于汽车保险费的计算公式是什么的知识,跟着华律网小编一起看看吧。 https://m.66law.cn/laws/507673.aspx
2.互联网车联网的智能车辆保险:实现风险控制的关键技术本文探讨了智能车辆保险如何利用互联网、大数据和人工智能技术,通过收集车辆运行数据进行风险评估和保费计算。文章详细介绍了智能车辆保险的发展背景、核心概念、算法原理、操作步骤,以及未来发展趋势和面临的挑战。 摘要由CSDN通过智能技术生成 1.背景介绍 随着互联网的普及和智能车的发展,车联网技术已经成为了智能化车辆的...https://blog.csdn.net/universsky2015/article/details/135793206
3.车险全险包括哪些对于因被保险机动车电器、线路、供气供油系统发生故障或者车上所载货物自身原因起火燃烧造成本车的损失,保险人负责赔偿。 车险计算公式有哪些 1、车险出险次数和次年保费呈正比关系 与之前不同的是,改革后的车险出险次数和第二年的保费呈正比关系,也就是今年的出险次数越少,第二年续保时的保费就越少。相反,出险次数...https://www.jy135.com/qiche/106375.html
4.汽车配件定倍率,汽车配件定倍率计算公式企业可以运用先进的数据分析和预测算法,不断优化配件订货量公式。通过引入机器学习和人工智能等技术,精确预测需求变化,并快速自动调整订货量。 3.2 合理制定库存目标 企业应根据销售预测和供应链弹性情况,合理制定库存目标。对于重要配件,可以采取保险库存的策略,以应对突发需求。 http://www.xiaoche5.com/qiche/29937.html
5.养老金算法例子随着经济的发展,很多人都开始购买汽车,而购买了汽车以后就要考虑购买汽车保险,但是很多人对于汽车保险如何计算都不太了解。那么,汽车商业保险算法是什么呢?商业车险包括车损险、盗抢险、三者险、车上人员责任险等基本险险种,以及划痕险、玻璃险、不计免... ...https://m.shenlanbao.com/he/34239
6.汽车附加费如何计算方法汽车的附加费用通常包括购置税、保险费、上牌费等。这些费用的算法和收取标准因地区而异,但大致的计算方法如下: 1. 购置税:购置税是购车时必须要缴纳的一种税费,计算公式为:购置税=购车款/11.7。其中,购车款是指购买汽车的实际支付金额,不包括其他额外费用如装饰等。 2. 保险费:保险费的计算方式有多种,常见的...https://m.yiche.com/baike/300055.htm
7.雨花台区范文11篇(全文)5) 年用电量增长率 (X5) :是指台区本年度用电量相对于上一年度用电量的增长率, 反映了台区负荷增长水平。计算公式如下: 式中:P1为台区上一年度用电量;P2为台区本年度用电量。 2.2 综合评价算法 本文设计计算模型来量化台区的运行状态, 采用改进型序关系分析法来确定各项指标的权重。 https://www.99xueshu.com/w/ikeywvirpq7o.html
8.车购置税多少钱(车的购置税交多少钱)10%。辆购置税实行从价定率的办法计算应纳税额,计算公式为,应纳税额=计税价格乘以税率。消费者买的是进口私车的话,计税价格的计算公式为计税价格=关税完税价格+关税+消费税。 车辆购置税要多少钱 购买过车辆的朋友都知道,在我们购买了新车之后,是一定要缴纳车辆购置税和保险的。而且,不同种类车辆的价格不同,所缴...https://www.sdtfbj.com/post/85493.html