查表获得对应的平均随机一致性指标RIRIRI
方法一
算数平均法
方法二
几何平均法
方法三
特征值法
距离计算
距离计算评分
模糊综合评价法是一种基于模糊数学的综合评价方法
例如
颜值直接人工打分
权重可以使用前面讲过的熵权法、方差法或判断矩阵法
求目标函数在一定约束条件下的极值问题
$$
这种方法叫做蒙特卡洛模拟
确定状态
通常用f[x,y,...]f[x,y,...]f[x,y,...]表示当前最优解
状态转移方程
写出f[x,y,...]f[x,y,...]f[x,y,...]与f[x1,y,...]f[x-1,y,...]f[x1,y,...]之类的关系
初始或边界条件
写出f[0,0,...]f[0,0,...]f[0,0,...]之类的取值
计算顺序
可能逆序推或顺推
计算顺序为从1到nnn,从1到WWW,最后输出f(n,W)f(n,W)f(n,W)结果即可。
旅行商问题的解空间就是1~~n的全排列
把父亲标号ttt后面的部分接到母亲后面
把母亲取出来的数字接到父亲后面
选择每个节点的概率正比于ταηβτ^αη^βταηβ
点iii到点jjj的边权记为wijw_{ij}wij
图的基本概念
边列表
邻接表
邻接矩阵
实际问题
求出从所有起点到其他店的最短路径
如果是更新它
先要拓扑排序
研究内容
适用数据
连续数值变量
分类
一元线性回归
多元线性回归
β0\beta_0β0、β1\beta_1β1是回归系数
线性回归的目标是找到最优的系数β0\beta_0β0,β1\beta_1β1,β2\beta_2β2,…\dots…,βp\beta_pβp,使得模型预测的值与真实值之间的误差最小。
要想估计x0x_0x0对应的y0y_0y0
训练误差
模型在训练集上的误差
泛化误差
模型在测试集上的误差
欠拟合
过拟合
预测模型最后实际上给出的是一个属于类1的概率p
当p取不同值的时候
k值的选取和距离度量的选择会影响判断的结果
可以生成任意姓形状的决策边界
数据预处理、选择合适的距离度量是非常重要
选择较大者作为预测的分类
在生成树的过程中就进行剪枝
对类和属性的分布不需要任何假设
构建决策树和使用决策树进行预测的效率都很高
相对容易解释
对噪声的干扰具有很好健壮性
冗余属性不会造成不利影响
与某个参考模型或实际情况进行比较
凝聚度SSE
各个簇内部点的距离平方的平均值
分离度SSB
各个簇质心到整体均值的距离平方和
这种簇会趋向于圆球状
随机选择K歌点作为初始质心
重复以下步骤
重新计算质心
直到质心不再发生变化
先随机选择一个点
仅限于具有中心概念的数据
离群点影响很大
K值必须事先指定
判断每个点属于核心点、边界点还是噪声点
删除噪声点
将边界点指派到关联的簇当中
基于密度的定义是相对抗噪声的
对于高维数据的密度定义困难
这种方法需要定义簇的邻近性
这种方法需要确定如何判断分裂哪个簇、如何分裂
注意
其中凝聚法更为常用
预先计算邻近矩阵
每一步合并最接近的两个簇
更新邻近矩阵
组平均
两个簇中所有点对距离的平均值
Ward方法
两个簇合并时导致平方误差的增量
质心方法
两个簇的质心距离
能形成层次结构
有时能产生高质量的聚类
计算开销大
强平稳
数据分布在实践的平移下的分布保持不变
弱平稳
一阶差分是指当前时刻的观察值减去上一时刻的观察值
意义
度量方法
度量结果
截尾
拖尾
离群点
删除
缺失值
替换方法
具备年内周期性
比较不同组别之间的差异
对连续的指标测量所得到的数值
两个或者多个已排序的类别
预测变量或解释变量
应答变量或结局变量
用于比较三个或三个以上组别的均值是否存在显著差异的统计方法
激活函数对输入信息进行非线性变换。然后将变换后的输入信息作为信息传给下一层神经元
数据集的规模和复杂性
模型的稀疏性
训练模型
学习率的调整
使用案例一般包括房价预测、股票走势或测试成绩等连续变化的案例
常见的回归模型
岭回归
决策树回归
深度学习
自变量X至少一项或以上的定量变量或二分类定类变量
使用案例包括邮件过滤、金融欺诈和预测雇员异动等输出为类别的任务
分类模型
聚类模型
降维模型
自编码器AE
周期型边界
固定边界
所有边界外元胞均取某一固定常量。
绝热边界
边界外元胞的状态始终和边界元胞的状态保持一致。
演化规则
根据元胞当前状态及其邻居状态确定下一时刻该元胞状态的动力学函数。
通过简单的规则展示了复杂系统的动态行为和模式生成能力。