|
DPS数据
处理系统最近更新简况(2007.12.13) 。
增加了新的数据文件类型,扩展名为
.dps,该类型文件包括了电子表格及下部文本编辑器中的数据,解决了以前分为两个文件保存的不足之处;
改进了另存为 Excel类型文件功能;
改进了随机前沿面分析功能模块;
增加了 Ctrl + R
组合键功能,控制是否执行“撤销/重做”,不再需要通过菜单方式进行控制;
改进了正交设计方差分析的用户界面,使之功能更为全面;

数据包络分析
中的若干功能模块,如松弛测度模型等已加入到DPS系统中。其功能菜单如下图所示(2007.10.30)。


根据DPS用户的建议,我们在因子分析(factor analysis)中,增加了另外几种初始因子估计方法,即迭代主因子法(Iterated
principal factor)、极大似然法(Maximum
likelihood)、未加权最小二乘法(unweighted least squares)及广义最小二乘法(Generalized least
squares),使得因子分析功能更加完善。其用户界面如下(2007.09.15):


应DPS软件用户要求,在专业统计的数学生态学方法中,群落多样性指数计算,
增加了采用Bootstrap方法计算多样性指数95%置信区间的功能(用户界面及结果如下图所示)(2007.08.31)。

同时,多样性指数计算、群落相似系数(距离系数)计算及两群落差异随机化检验这几个功能,数据格式既可以一行一个样本,也可以一列一个样本方式,以适应物种数大于255个的实际需求。

DPS农业病虫灾变预警分析专用版v1.0(2007.07.14):
为适应植物保护工作的需求,提供农业病虫灾变风险预警分析技术,组装了DPS农业病虫灾变预警分析专用版,以供植保专业技术人员在农作物病虫灾变预测预警工作中应用。

列联表确切概率计算过程中,增加了迭代计算时间控制的交互式用户对话框,形式如下:(2007.07.14)


数据挖掘领域中动态聚类分析技术获重大突破
以组内平方和最小为
优化的目标函数,我们提出并实现了一个新的动态聚类算法,并将该新的动态聚类技术加入到DPS系统之中(2007年5月1日完成基本算法;继续优化程序,2007年7月5日更新)。
应用Fisher(1936)的Iris数据(5个变量150个样本)例子进行动态聚类分析,当分类数在3~15个时,SAS及SPSS的K-means法和DPS提供的最小组内平方和方法计算结果,以组内平方和作为考查指标,列表如下。结果表明:DPS系统提供的最小组内平方和方法比目前流行的K-means动态聚类方法要好得多(该算法的结果与初始分类无关,可基于随机分组为基础进行计算)。
该研究系版主主持的863计划项目(2006AA10Z217)的一部分,研究工作得到
了国家高技术研究发展计划(863计划)资助。
不同动态聚类方法组内平方和(越小越好)列表
|
分类类别数 |
SPSS的k-means法 |
DPS的最小组内平方和 |
DPS组内平方和下降(%)
(SPSS-DPS)/SPSS×100 |
|
3 |
7897.877 |
7897.877 |
0.000 |
|
4 |
5750.971 |
5733.587 |
0.302 |
|
5 |
5010.352 |
4654.245 |
7.107 |
|
6 |
3913.625 |
3913.625 |
0.000 |
|
7 |
3549.878 |
3433.436 |
3.280 |
|
8 |
3431.661 |
3002.495 |
12.506 |
|
9 |
2932.100 |
2782.210 |
5.112 |
|
10 |
2716.078 |
2586.847 |
4.758 |
|
11 |
2585.576 |
2405.182 |
6.977 |
|
12 |
2379.975 |
2242.834 |
5.762 |
|
13 |
2185.410 |
2102.274 |
3.803 |
|
14 |
2097.074 |
1966.895 |
6.208 |
|
15 |
1979.880 |
1869.274 |
5.587 |
动态聚类新的用户界面如下
在动态聚类用户界面中,一般情况下只要给定分组组数即可。如样本太多,或分类组数太多,则可指定迭代精度水平(取值范围1~10,一般取5);在大样本情形下,可指定迭代计算的时间控制(范围是1~60分钟)。

该例数据的计算结果如下:
Cell Clipboard
| 计算结果 |
当前日期 2007-5-4 21:08:47 |
|
|
| No. |
平均值 |
标准差 |
|
|
|
| X1 |
7.5556 |
4.7463 |
|
|
|
| X2 |
8.5556 |
4.6934 |
|
|
|
| 初始分类: |
|
|
|
|
|
| 总平方和 SSt=356.44444 |
组内平方和 SSw=93.33333 |
|
|
| |
|
|
|
|
|
| 迭代步数 |
样本号 |
移出组 |
放入组 |
SS减少 |
SSw |
| 1 |
2 |
1 |
2 |
21.7500 |
71.5833 |
| 2 |
5 |
2 |
1 |
10.9167 |
60.6667 |
| 运行时间0秒。 |
|
|
|
|
| |
|
|
|
|
|
| 动态聚类结果 |
|
|
|
|
|
| 组别 |
样本号 |
X1 |
X2 |
到中心距离 |
距离平方 |
| 1 |
3 |
3.0000 |
1.0000 |
3.3333 |
11.1111 |
| 1 |
5 |
7.0000 |
6.0000 |
3.2830 |
10.7778 |
| 1 |
8 |
7.0000 |
2.0000 |
1.6667 |
2.7778 |
| 第1组3个样本 |
平均值 |
5.6667 |
3.0000 |
RMSTD=2.483277 |
| 2 |
1 |
6.0000 |
13.0000 |
3.0732 |
9.4444 |
| 2 |
2 |
2.0000 |
8.0000 |
3.4319 |
11.7778 |
| 2 |
6 |
3.0000 |
12.0000 |
1.2019 |
1.4444 |
| 第2组3个样本 |
平均值 |
3.6667 |
11.0000 |
RMSTD=2.380476 |
| 3 |
4 |
15.0000 |
11.0000 |
1.7951 |
3.2222 |
| 3 |
7 |
12.0000 |
10.0000 |
2.1344 |
4.5556 |
| 3 |
9 |
13.0000 |
14.0000 |
2.3570 |
5.5556 |
| 第3组3个样本 |
平均值 |
13.3333 |
11.6667 |
RMSTD=1.825742 |
| 最小组内平方和 SSw=60.666667 |
|
|
|
| R方统计量 RSQ=0.829800 |
|
|
|
| 伪F值(Pseudo F) PSF=34.128205 |
|
|
|
Cell Clipboard

应用于经济、技术效率分析的Malmquist指数计算功能
已加入到DPS之中(2007.04.24)
Malmquist指数计算分析的数据编辑格式如下:
如果数据有n个单位,每个单位含有p个时期的m个输入x和s个输出y(实为面板数据Panel data),这时数据编辑、定义格式为:
单位编号(1,2,3,...n),时期(年份)编号(1,2,3,...p),xi1,xi2,...,xim,yi1,yi2,...,yis
例如有5个单位3个时期的一个输入、一个输出资料,按如下方式编辑、选中数据后,即可执行分析计算。

执行时,在“专业统计”中的“计量经济”子菜单下面选择“Malmquist指数分析”即可
得到如下结果。 Cell Clipboard
| Malmuist指数分析计算 |
|
|
|
| 距离汇总: |
|
|
|
|
|
| 年份(时期)=1 |
|
|
|
|
|
| DMUi |
CRS-te(t-1) |
CRS-te(t) |
CRS-te(t+1) |
VRS-te |
|
| DMU1 |
0.0000 |
0.5000 |
0.3750 |
1.0000 |
|
| DMU2 |
0.0000 |
0.5000 |
0.3750 |
0.5455 |
|
| DMU3 |
0.0000 |
1.0000 |
0.7500 |
1.0000 |
|
| DMU4 |
0.0000 |
0.8000 |
0.6000 |
0.9231 |
|
| DMU5 |
0.0000 |
0.8333 |
0.6250 |
1.0000 |
|
| 平均值 |
0.0000 |
0.7267 |
0.5450 |
0.8937 |
|
| |
|
|
|
|
|
| 年份(时期)=2 |
|
|
|
|
|
| DMUi |
CRS-te(t-1) |
CRS-te(t) |
CRS-te(t+1) |
VRS-te |
|
| DMU1 |
0.5000 |
0.3750 |
0.3750 |
1.0000 |
|
| DMU2 |
0.7500 |
0.5625 |
0.5625 |
0.6667 |
|
| DMU3 |
1.3333 |
1.0000 |
1.0000 |
1.0000 |
|
| DMU4 |
0.6000 |
0.4500 |
0.4500 |
0.6000 |
|
| DMU5 |
1.0000 |
0.7500 |
0.7500 |
1.0000 |
|
| 平均值 |
0.8367 |
0.6275 |
0.6275 |
0.8533 |
|
| |
|
|
|
|
|
| 年份(时期)=3 |
|
|
|
|
|
| DMUi |
CRS-te(t-1) |
CRS-te(t) |
CRS-te(t+1) |
VRS-te |
|
| DMU1 |
0.3750 |
0.3750 |
0.0000 |
1.0000 |
|
| DMU2 |
0.5625 |
0.5625 |
0.0000 |
0.6667 |
|
| DMU3 |
1.0000 |
1.0000 |
0.0000 |
1.0000 |
|
| DMU4 |
0.4500 |
0.4500 |
0.0000 |
0.6000 |
|
| DMU5 |
0.7500 |
0.7500 |
0.0000 |
1.0000 |
|
| 平均值 |
0.6275 |
0.6275 |
0.0000 |
0.8533 |
|
| |
|
|
|
|
|
| Malmuist指数汇总: |
|
|
|
| 年份(时期)=2 |
|
|
|
|
|
| DMUi |
技术效率 |
技术变化 |
纯技术效率 |
规模效率 |
生产率 |
| DMU1 |
0.7500 |
1.3333 |
1.0000 |
0.7500 |
1.0000 |
| DMU2 |
1.1250 |
1.3333 |
1.2222 |
0.9205 |
1.5000 |
| DMU3 |
1.0000 |
1.3333 |
1.0000 |
1.0000 |
1.3333 |
| DMU4 |
0.5625 |
1.3333 |
0.6500 |
0.8654 |
0.7500 |
| DMU5 |
0.9000 |
1.3333 |
1.0000 |
0.9000 |
1.2000 |
| 几何平均 |
0.8436 |
1.3333 |
0.9550 |
0.8833 |
1.1248 |
| |
|
|
|
|
|
| 年份(时期)=3 |
|
|
|
|
|
| DMUi |
技术效率 |
技术变化 |
纯技术效率 |
规模效率 |
生产率 |
| DMU1 |
1.0000 |
1.0000 |
1.0000 |
1.0000 |
1.0000 |
| DMU2 |
1.0000 |
1.0000 |
1.0000 |
1.0000 |
1.0000 |
| DMU3 |
1.0000 |
1.0000 |
1.0000 |
1.0000 |
1.0000 |
| DMU4 |
1.0000 |
1.0000 |
1.0000 |
1.0000 |
1.0000 |
| DMU5 |
1.0000 |
1.0000 |
1.0000 |
1.0000 |
1.0000 |
| 几何平均 |
1.0000 |
1.0000 |
1.0000 |
1.0000 |
1.0000 |
| |
|
|
|
|
|
| Malmuist指数汇总结果 |
|
|
|
| DMUi |
技术效率 |
技术变化 |
纯技术效率 |
规模效率 |
生产率 |
| DMU1 |
0.8660 |
1.1547 |
1.0000 |
0.8660 |
1.0000 |
| DMU2 |
1.0607 |
1.1547 |
1.1055 |
0.9594 |
1.2247 |
| DMU3 |
1.0000 |
1.1547 |
1.0000 |
1.0000 |
1.1547 |
| DMU4 |
0.7500 |
1.1547 |
0.8062 |
0.9303 |
0.8660 |
| DMU5 |
0.9487 |
1.1547 |
1.0000 |
0.9487 |
1.0955 |
| 几何平均 |
0.9185 |
1.1547 |
0.9773 |
0.9398 |
1.0605 |
Cell Clipboard

数据包络分析C2R模型和BC2模型分析功能加入到DPS之中(2007.04.18,
5月17日更新C2R模型)
【作者按:许多搞经济统计分析的DPS用户,一直催着我将数据包络分析和随机前沿面模型分析内容加入到DPS中来,因精力有限、且学习相关方法需要时间,故直到今天才完成该项工作,在此对
我们的DPS用户朋友深表歉意。通过对数据包络分析和随机前沿面模型分析内容的学习、了解,发现它们在经济分析中确实有用,且两种方法各有长处,可互为补充。并祝愿搞经济统计分析的DPS用户朋友,应用数据包络分析和随机前沿面模型分析多出成果。】
这里以数据包络分析C2R模型分析
为例介绍其使用方法:数据编辑格式,一行放一个决策单元(DMU),一行中左边放该决策单元的输入数据,右边放输出数据。数据编辑格式如下图阴影部分所示:

在DPS的“专业统计”中的“计量经济”子菜单下面执行“数据包络分析”分析,系统显示用户工作界面如上图下部,在对话框中键入“输出变量个数”,再点击“OK”则得到结果如下(这里分析所用的是参考文献1中的例子,其结果
的详细分析、解释可见参考文献1,参考文献2):
|
计算结果 |
当前日期 2007-4-18 22:22:56 |
|
|
|
|
|
DMUi |
相对效率 |
X1权重 |
X2权重 |
X3权重 |
Y1权重 |
Y2权重 |
Y3权重 |
Y4权重 |
|
DMU1 |
1.0000 |
0.0000 |
0.0057 |
0.0024 |
0.0125 |
0.0000 |
0.0000 |
0.0000 |
|
DMU2 |
0.8982 |
0.0143 |
0.0000 |
0.0000 |
0.0000 |
0.0554 |
0.0071 |
0.0000 |
|
DMU3 |
1.0000 |
0.0000 |
0.0064 |
0.0000 |
0.0111 |
0.0000 |
0.0000 |
0.0000 |
|
DMU4 |
0.8206 |
0.0000 |
0.0014 |
0.0073 |
0.0000 |
0.0442 |
0.0000 |
0.0138 |
|
DMU5 |
1.0000 |
0.0000 |
0.0041 |
0.0189 |
0.0025 |
0.1155 |
0.0000 |
0.0000 |
| |
|
|
|
|
|
|
|
|
|
S* |
|
|
|
|
|
|
|
|
|
DMU1 |
1.0000 |
0.0000 |
0.0000 |
0.0000 |
0.0000 |
|
|
|
|
DMU2 |
0.8472 |
0.0000 |
0.1417 |
0.0000 |
0.0000 |
|
|
|
|
DMU3 |
0.0000 |
0.0000 |
1.0000 |
0.0000 |
0.0000 |
|
|
|
|
DMU4 |
1.0964 |
0.0000 |
0.0536 |
0.0000 |
0.3464 |
|
|
|
|
DMU5 |
0.0000 |
0.0000 |
0.0000 |
0.0000 |
1.0000 |
|
|
|
| |
|
|
|
|
|
|
|
|
|
非有效性DMUi的优化 |
|
|
|
|
|
|
DMUi |
x1 |
x2 |
x3 |
y1 |
y2 |
y3 |
y4 |
|
|
DMU2 |
62.8750 |
154.4083 |
56.5278 |
80.5278 |
13.0000 |
25.0000 |
4.0972 |
|
|
DMU4 |
82.4636 |
215.8215 |
70.5728 |
102.9272 |
17.0000 |
31.4454 |
5.0000 |
|
| |
|
|
|
|
|
|
|
|
|
S*- |
DMU1 |
DMU2 |
DMU3 |
DMU4 |
DMU5 |
|
|
|
|
x1 |
0.0000 |
0.0000 |
0.0000 |
4.5215 |
0.0000 |
|
|
|
|
x2 |
0.0000 |
25.2345 |
0.0000 |
0.0000 |
0.0000 |
|
|
|
|
x3 |
0.0000 |
105.1508 |
0.0000 |
0.0000 |
0.0000 |
|
|
|
| |
|
|
|
|
|
|
|
|
|
S*+ |
DMU1 |
DMU2 |
DMU3 |
DMU4 |
DMU5 |
|
|
|
|
y1 |
0.0000 |
20.5278 |
0.0000 |
6.9272 |
0.0000 |
|
|
|
|
y2 |
0.0000 |
0.0000 |
0.0000 |
0.0000 |
0.0000 |
|
|
|
|
y3 |
0.0000 |
0.0000 |
0.0000 |
3.4454 |
0.0000 |
|
|
|
|
y4 |
0.0000 |
2.0972 |
0.0000 |
0.0000 |
0.0000 |
|
|
|
应用C2R和BC2模型进行效益的分析和排序,虽然DEA对非有效的决策单元(DMU)能够提供很多信息,但对有效的DMU所提供信息很少,很多情形下其效率值均为1,而失去了根据效率值进行
综合评价分析和排序的初衷。DPS统计软件用户、淮阴师范学院的何伟先生建议将Andersen和Petersen对数据包络分析模型提出的改进方法(见参考文献3)放到DPS系统中,使得各个DMU的效率值均有所差别,这样便于
综合评价分析及排序。我们采纳了何先生的建议,将该方法加入进来,现在DPS系统里面的数据包络分析功能的新的用户界面如下(2007.05.17):

上面例子,应用改进的CCR模型,得到计算结果如下(现在非常适合于评价、排序之研究了 ^_^ ):
Cell
Clipboard
| DMUi |
相对效率 |
| DMU1 |
1.6961 |
| DMU2 |
0.8982 |
| DMU3 |
1.6560 |
| DMU4 |
0.8206 |
| DMU5 |
1.1290 |

随机前沿面模型分析及面板数据统计分析功能加入到DPS之中(2007.04.12)
随机前沿面模型分析的数据编辑格式如下:
xi1, xi2, ..., xim, yi
或
单位编号,时期编号,xi1,xi2,...,xim,yi
如果数据还含有p个表示时间变化趋势的变量z(这时为面板数据Panel data模型分析),这时数据编辑、定义格式为:
单位编号,时期编号,xi1,xi2,...,xim,zi1,zi2,...,zip,yi
该功能在“专业统计”中的“计量经济”子菜单下面。
有人对医院的效率进行了综合评价,评价体系有4个输入指标,输出指标
为医疗收入。分析时数据格式编辑如下图上部:

在DPS的“专业统计”中的“计量经济”子菜单下面执行“随机前沿面模型”分析,系统显示用户工作界面如上图
下面所示,该问题是应用该模块的最基本功能,点击“确定”按钮后得到结果如下:
|
误差组分前沿面, 生产函数模型 |
|
|
|
|
|
因变量未取对数 |
|
|
|
|
|
|
OLS估计值: |
|
|
|
|
|
|
|
|
项目 |
系数 |
标准误 |
T值 |
P值 |
|
|
|
|
β0 |
-92.5178 |
96.6465 |
-0.9573 |
0.3754 |
|
|
|
|
β1 |
0.8210 |
0.5205 |
1.5772 |
0.1658 |
|
|
|
|
β2 |
0.3938 |
0.4041 |
0.9746 |
0.3674 |
|
|
|
|
β3 |
0.0210 |
0.2471 |
0.0851 |
0.9350 |
|
|
|
|
β4 |
0.1917 |
0.6723 |
0.2852 |
0.7851 |
|
|
|
|
σ-SQUARED |
4158.1055 |
|
|
|
|
|
|
|
对数似然函数 |
-58.1051 |
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|
网格搜索估计值: |
|
|
|
|
|
|
|
β0 |
-30.3404 |
|
|
|
|
|
|
|
β1 |
0.8210 |
|
|
|
|
|
|
|
β2 |
0.3938 |
|
|
|
|
|
|
|
β3 |
0.0210 |
|
|
|
|
|
|
|
β4 |
0.1917 |
|
|
|
|
|
|
|
σ^2 |
6134.0892 |
|
|
|
|
|
|
|
γ |
0.9900 |
|
|
|
|
|
|
|
μ被限制于0 |
|
|
|
|
|
|
|
|
η被限制于0 |
|
|
|
|
|
|
|
|
Iter=0 |
对数似然函数=-57.473318 |
|
|
|
|
|
|
-30.3404 |
0.8210 |
0.3938 |
0.0210 |
0.1917 |
6134.0892 |
0.9900 |
|
|
梯度步长 |
|
|
|
|
|
|
|
|
Iter=5 |
对数似然函数=-56.074462 |
|
|
|
|
|
|
-30.3413 |
0.8581 |
0.3611 |
-0.0147 |
0.3111 |
6134.0892 |
1.0000 |
|
|
Iter=10 |
对数似然函数=-55.358895 |
|
|
|
|
|
|
-30.3467 |
1.0453 |
0.1171 |
-0.0569 |
0.4338 |
6134.0890 |
1.0000 |
|
|
Iter=15 |
对数似然函数=-55.283964 |
|
|
|
|
|
|
-30.3515 |
1.0720 |
0.0637 |
-0.0565 |
0.4516 |
6134.0889 |
1.0000 |
|
|
Iter=18 |
对数似然函数=-55.282266 |
|
|
|
|
|
|
-30.3516 |
1.0726 |
0.0626 |
-0.0565 |
0.4520 |
6134.0889 |
1.0000 |
|
|
极大似然估计结果: |
|
|
|
|
|
|
|
项目 |
系数 |
标准误 |
T值 |
p-值 |
|
|
|
|
β0 |
-30.3516 |
1.0033 |
-30.2520 |
0.0001 |
|
|
|
|
β1 |
1.0726 |
0.2934 |
3.6559 |
0.0106 |
|
|
|
|
β2 |
0.0626 |
0.6034 |
0.1037 |
0.9208 |
|
|
|
|
β3 |
-0.0565 |
0.0151 |
-3.7306 |
0.0097 |
|
|
|
|
β4 |
0.4520 |
0.1978 |
2.2849 |
0.0624 |
|
|
|
|
σ^2 |
6134.0889 |
1.0000 |
6134.0826 |
|
|
|
|
|
γ |
| |