数学建模之TOPSIS法-小七博客

TOPSIS法（Technique for Order Preference by Similarity to an Ideal Solution ）可以理解为逼近理想解排序法，国内也称作优劣解距离法。该方法只要求各效用函数具有单调递增(或递减）性就行。TOPSIS法是多目标决策分析中一种常用的有效方法。
举个例子：一个寝室四个人的高数成绩如下：

数学建模之TOPSIS法
在这种情况下，我们如何确定权重（评分）呢？归一化！
归一化：是一种无量纲处理手段，使物理系统数值的绝对值变成某种相对值关系。简化计算，缩小量值的有效办法。
那么你可能也听说过标准化这个词
标准化：当几种参数的单位不一致时，使用标准化去除量纲。
这里我们采用的构造方式为(x−minmax−min)genfrac (){1pt}{1}{x-min}{max-min} ，缩小量值，然后归一化，让他们评分相加为1.
数学建模之TOPSIS法
我们为什么采用这样的评分标准：

首先一般评价的对象一般远超于2个。
比较的指标也往往不是一个方面。
有很多指标不存在理论上的最大最小值，例如GDP增速。

当我们增加一个指标时：
数学建模之TOPSIS法
成绩属于极大型指标（效益性指标），属于越大越好。
争吵属于极小型指标（成本型指标），属于越小越好。
此时，我们需要把两种指标转化为相同方向。（统一指标类型）
将所有指标正向化处理，极小型指标转化极大型指标公式max−xmax-x
数学建模之TOPSIS法
此时我们可以发现，争吵次数与成绩是两种不同单位的指标参数，所以我们利用标准化来去除量纲的影响。
假设有n个要评价的对象，m个指标参数（都已经正向化），构成的正向化矩阵为：X = [x11...x1mx21...x2m.........xn1...xnm]begin{bmatrix} x_{11} & ... & x_{1m} \ x_{21} & ... & x_{2m} \ ... & ... & ... \ x_{n1} & ... & x_{nm} \ end{bmatrix}，那么标准化后的矩阵记为Z，Z中的每一个元素：zij=xij/∑i=1nxij2z_{ij}= x_{ij}/sqrt{displaystylesum_{i=1}^nx_{ij}^2}，经过变换：
[891603742990]begin{bmatrix} 89 &1 \ 60 &3\ 74&2\ 99&0 \ end{bmatrix} =====>[0.54370.26730.36650.80180.45200.53450.60480]begin{bmatrix} 0.5437 &0.2673 \ 0.3665 &0.8018\ 0.4520&0.5345\ 0.6048&0 \ end{bmatrix} 相关代码：清风数学建模

1.类比只有一个指标的计算得分

假设有n个要评价的对象，m个指标指标的标准化矩阵：Z=[z11...z1mz21...z2m.........zn1...znm]Z = begin{bmatrix} z_{11} & ... & z_{1m} \ z_{21} & ... & z_{2m} \ ... & ... & ... \ z_{n1} & ... & z_{nm} \ end{bmatrix},我们定义每一指标的最大值Zi+Z^+_i ，最小值Zi−Z^-_i，定义第i(i=1,2,3…n)个评价对象与最大值的距离 Di+=∑j=1m(Zi+−zij)2D_i^+= sqrt{displaystylesum_{j=1}^m(Z_i^+-z_{ij})^2},第i(i=1,2,3…n)个评价对象与最小值的距离 Di−=∑j=1m(Zi−−zij)2D_i^-= sqrt{displaystylesum_{j=1}^m(Z_i^--z_{ij})^2}，那么评价对象未归一化的得分：Si=Di−Di−+Di+S_i =tfrac{D_i^-}{D_i^-+D_i^+},明显可以看出SiS_i一定是在0到1之间，即Di+D_i^+这个最大距离越小，SiS_i越大，即越接近最大值。这也是为什么TOPSIS也叫做优劣解距离法

2.解题步骤

第一步：将原始矩阵正向化
最常见的四种指标：
数学建模之TOPSIS法
如何极小型转化极大型：

max - x：最大值减去当前x
如果所有元素都为正数，直接变成倒数1xtfrac{1}{x}

如何中间型转化极大型：
设中间型为xbestx_{best}，那么未归一化得分公式为M=max(∣xi−xbest∣)M = max(|x_i-x_{best}|)，xi~=1−∣xi−xbest∣Mwidetilde{x_i}=1-tfrac{|x_i-x_{best}|}{M}

如何区间型转化极大型：
是指值落在某个区间内最好，设区间为[a,b]，有M=max(a−min(xi),max(xi)−b)M = max(a-min(x_i),max(x_i)-b)
xi~={1−a−xM,x<a1,a<=x<=b1−x−bM,x>bwidetilde{x_i} = begin{cases} 1- tfrac{a-x}{M} ,x < a \ 1 ,a <= x <= b\ 1- tfrac{x-b}{M} ,x > b end{cases}

第二步: 将正向化转换成标准化：假设有n个要评价的对象，m个指标参数（都已经正向化），构成的正向化矩阵为：X=[x11...x1mx21...x2m.........xn1...xnm] X = begin{bmatrix} x_{11} & ... & x_{1m} \ x_{21} & ... & x_{2m} \ ... & ... & ... \ x_{n1} & ... & x_{nm} \ end{bmatrix}，那么标准化后的矩阵记为Z，Z中的每一个元素：
zij=xij/∑j=1mxij2z_{ij}= x_{ij}/sqrt{displaystylesum_{j=1}^mx_{ij}^2}每一个元素/其所在列的平方和每一个元素/sqrt{其所在列的平方和}

第三步： 计算得分并归一化。
这就是TOPSIS的流程~

补充：基于熵权法对TOPSIS模型的修正

由于层次分析法的主观性影响太大，所以我们利用熵权法（一种客观客观赋权的方法）。
什么是熵权法：

按照信息论基本原理的解释，信息是系统有序程度的一个度量，熵是系统无序程度的一个度量；如果指标的信息熵越大，该指标提供的信息量越大，在综合评价中所起作用理当越大，权重就应该越高。因此，可利用信息熵这个工具，计算出各个指标的权重，为多指标综合评价提供依据。

这里的信息熵我们看作是方差，方差越大，波动程度越大，意味着权重也就越大。
数学建模之TOPSIS法
越可能发生的事情，信息量越小；
越不可能发生的事情，信息量就越大。

熵权法的计算步骤

1.判断输入的矩阵中是否存在负数，如果有则要重新标准化到非负区间（后面计算概率时要保证每一个元素为非负数）
Z(ij)=x(ij)−min(x(ij))max(x(ij))−min(x(ij))Z_(ij) = tfrac{x_(ij)-min(x_(ij))}{max(x_(ij))-min(x_(ij))}
2.计算第j项指标下第i个样本所占的权重，并将其看作相对熵计算所用到的概率。
Z~=[z~11...z~1mz~21...z~2m.........z~n1...z~nm]widetilde Z = begin{bmatrix} widetilde z_{11} & ... &widetilde z_{1m} \ widetilde z_{21} & ... &widetilde z_{2m} \ ... & ... & ... \ widetilde z_{n1} & ... &widetilde z_{nm} \ end{bmatrix}
pij=z~ij/∑i=1nz~ij p_{ij} = widetilde z_{ij}/sqrt{displaystylesum_{i=1}^nwidetilde z_{ij}}
保证了每一个概率之和相加为1.
3.计算每个指标的信息熵，并计算信息效用值，并归一化得到每一个指标的熵权。对于第j个指标而言，其信息熵的计算公式为：
ej=−1lnn∑i=1npijln(pij) e_j = - tfrac{1}{lnn}sum_{i=1}^np_{ij}ln(p_{ij})
eje_j越大，所代表第j个指标的信息熵越大，信息熵越大他本身所包含的信息量就越少，就像前面例子所说，每次考试都考第一名高考一定会考上清华，毋庸置疑，大家是一定相信的，所以包含的信息相对少；而吊车尾突然考上清华，大家就会猜测，他是怎么考上的呢？这里包含的信息量就相对大。
信息效用值：dj=1−ejd_j = 1 - e_j信息效用值越大，其对应所含的信息就越多。将信息效用值进行归一化，我们就能得到每一个指标的熵权：Wj=dj/∑j=1mdj（j=1,2,3...）W_j = d_j /displaystylesum_{j=1}^md_j （j = 1,2,3...）

熵权法的依据原理

指标的变异程度越小，所反映的信息量也越少，其对应的权值也相应越低。

本文来互联网采集，已注明来源，如未注明来源可能来源未知，如有侵权请联系站长删除处理。