Refine Information Tech. Co., LtD

往年新增内容:2007年 2006年 2005年 2004年 2003年 2002年 2001年

        DPS数据 处理系统最近更新简况(2007.12.13)

        增加了新的数据文件类型,扩展名为 .dps,该类型文件包括了电子表格及下部文本编辑器中的数据,解决了以前分为两个文件保存的不足之处;

       改进了另存为 Excel类型文件功能;

       改进了随机前沿面分析功能模块;

       增加了 Ctrl + R 组合键功能,控制是否执行“撤销/重做”,不再需要通过菜单方式进行控制;

       改进了正交设计方差分析的用户界面,使之功能更为全面;

 

     数据包络分析 中的若干功能模块,如松弛测度模型等已加入到DPS系统中。其功能菜单如下图所示(2007.10.30)。

 

    

     根据DPS用户的建议,我们在因子分析(factor analysis)中,增加了另外几种初始因子估计方法,即迭代主因子法(Iterated principal factor)、极大似然法(Maximum likelihood)、未加权最小二乘法(unweighted least squares)及广义最小二乘法(Generalized least squares),使得因子分析功能更加完善。其用户界面如下(2007.09.15):

 

 

 

     

 

      应DPS软件用户要求,在专业统计的数学生态学方法中,群落多样性指数计算, 增加了采用Bootstrap方法计算多样性指数95%置信区间的功能(用户界面及结果如下图所示)(2007.08.31)。

     

      

       同时,多样性指数计算、群落相似系数(距离系数)计算及两群落差异随机化检验这几个功能,数据格式既可以一行一个样本,也可以一列一个样本方式,以适应物种数大于255个的实际需求。

 

   

 

   DPS农业病虫灾变预警分析专用版v1.0(2007.07.14)

   为适应植物保护工作的需求,提供农业病虫灾变风险预警分析技术,组装了DPS农业病虫灾变预警分析专用版,以供植保专业技术人员在农作物病虫灾变预测预警工作中应用。

 

 

   列联表确切概率计算过程中,增加了迭代计算时间控制的交互式用户对话框,形式如下:(2007.07.14)

      

 

 

        数据挖掘领域中动态聚类分析技术获重大突破

      以组内平方和最小为 优化的目标函数,我们提出并实现了一个新的动态聚类算法,并将该新的动态聚类技术加入到DPS系统之中(2007年5月1日完成基本算法;继续优化程序,2007年7月5日更新)。

        应用Fisher(1936)的Iris数据(5个变量150个样本)例子进行动态聚类分析,当分类数在3~15个时,SAS及SPSS的K-means法和DPS提供的最小组内平方和方法计算结果,以组内平方和作为考查指标,列表如下。结果表明:DPS系统提供的最小组内平方和方法比目前流行的K-means动态聚类方法要好得多(该算法的结果与初始分类无关,可基于随机分组为基础进行计算)。

       该研究系版主主持的863计划项目(2006AA10Z217)的一部分,研究工作得到 了国家高技术研究发展计划(863计划)资助。

    

不同动态聚类方法组内平方和(越小越好)列表

分类类别数 SPSS的k-means法 DPS的最小组内平方和

DPS组内平方和下降(%)

(SPSS-DPS)/SPSS×100

3 7897.877 7897.877 0.000
4 5750.971 5733.587 0.302
5 5010.352 4654.245 7.107
6 3913.625 3913.625 0.000
7 3549.878 3433.436 3.280
8 3431.661 3002.495 12.506
9 2932.100 2782.210 5.112
10 2716.078 2586.847 4.758
11 2585.576 2405.182 6.977
12 2379.975 2242.834 5.762
13 2185.410 2102.274 3.803
14 2097.074 1966.895 6.208
15 1979.880 1869.274 5.587

 

        动态聚类新的用户界面如下 在动态聚类用户界面中,一般情况下只要给定分组组数即可。如样本太多,或分类组数太多,则可指定迭代精度水平(取值范围1~10,一般取5);在大样本情形下,可指定迭代计算的时间控制(范围是1~60分钟)。

   

      该例数据的计算结果如下: Cell Clipboard</font>

计算结果 当前日期 2007-5-4 21:08:47    
No. 平均值 标准差      
X1 7.5556 4.7463      
X2 8.5556 4.6934      
初始分类:          
总平方和 SSt=356.44444 组内平方和 SSw=93.33333    
           
迭代步数 样本号 移出组 放入组 SS减少 SSw
1 2 1 2 21.7500 71.5833
2 5 2 1 10.9167 60.6667
运行时间0秒。        
           
动态聚类结果          
组别 样本号 X1 X2 到中心距离 距离平方
1 3 3.0000 1.0000 3.3333 11.1111
1 5 7.0000 6.0000 3.2830 10.7778
1 8 7.0000 2.0000 1.6667 2.7778
第1组3个样本 平均值 5.6667 3.0000 RMSTD=2.483277
2 1 6.0000 13.0000 3.0732 9.4444
2 2 2.0000 8.0000 3.4319 11.7778
2 6 3.0000 12.0000 1.2019 1.4444
第2组3个样本 平均值 3.6667 11.0000 RMSTD=2.380476
3 4 15.0000 11.0000 1.7951 3.2222
3 7 12.0000 10.0000 2.1344 4.5556
3 9 13.0000 14.0000 2.3570 5.5556
第3组3个样本 平均值 13.3333 11.6667 RMSTD=1.825742
最小组内平方和 SSw=60.666667      
R方统计量 RSQ=0.829800      
伪F值(Pseudo F) PSF=34.128205      
Cell Clipboard

 

       应用于经济、技术效率分析的Malmquist指数计算功能 已加入到DPS之中(2007.04.24)

      Malmquist指数计算分析的数据编辑格式如下:

      如果数据有n个单位,每个单位含有p个时期的m个输入x和s个输出y(实为面板数据Panel data),这时数据编辑、定义格式为:

 

                               单位编号(1,2,3,...n),时期(年份)编号(1,2,3,...p),xi1,xi2,...,xim,yi1,yi2,...,yis

 

     例如有5个单位3个时期的一个输入、一个输出资料,按如下方式编辑、选中数据后,即可执行分析计算。

 

 

     执行时,在“专业统计”中的“计量经济”子菜单下面选择“Malmquist指数分析”即可 得到如下结果。

 Cell Clipboard</font>
Malmuist指数分析计算      
距离汇总:          
年份(时期)=1          
DMUi CRS-te(t-1) CRS-te(t) CRS-te(t+1) VRS-te  
DMU1 0.0000 0.5000 0.3750 1.0000  
DMU2 0.0000 0.5000 0.3750 0.5455  
DMU3 0.0000 1.0000 0.7500 1.0000  
DMU4 0.0000 0.8000 0.6000 0.9231  
DMU5 0.0000 0.8333 0.6250 1.0000  
平均值 0.0000 0.7267 0.5450 0.8937  
           
年份(时期)=2          
DMUi CRS-te(t-1) CRS-te(t) CRS-te(t+1) VRS-te  
DMU1 0.5000 0.3750 0.3750 1.0000  
DMU2 0.7500 0.5625 0.5625 0.6667  
DMU3 1.3333 1.0000 1.0000 1.0000  
DMU4 0.6000 0.4500 0.4500 0.6000  
DMU5 1.0000 0.7500 0.7500 1.0000  
平均值 0.8367 0.6275 0.6275 0.8533  
           
年份(时期)=3          
DMUi CRS-te(t-1) CRS-te(t) CRS-te(t+1) VRS-te  
DMU1 0.3750 0.3750 0.0000 1.0000  
DMU2 0.5625 0.5625 0.0000 0.6667  
DMU3 1.0000 1.0000 0.0000 1.0000  
DMU4 0.4500 0.4500 0.0000 0.6000  
DMU5 0.7500 0.7500 0.0000 1.0000  
平均值 0.6275 0.6275 0.0000 0.8533  
           
Malmuist指数汇总:      
年份(时期)=2          
DMUi 技术效率 技术变化 纯技术效率 规模效率 生产率
DMU1 0.7500 1.3333 1.0000 0.7500 1.0000
DMU2 1.1250 1.3333 1.2222 0.9205 1.5000
DMU3 1.0000 1.3333 1.0000 1.0000 1.3333
DMU4 0.5625 1.3333 0.6500 0.8654 0.7500
DMU5 0.9000 1.3333 1.0000 0.9000 1.2000
几何平均 0.8436 1.3333 0.9550 0.8833 1.1248
           
年份(时期)=3          
DMUi 技术效率 技术变化 纯技术效率 规模效率 生产率
DMU1 1.0000 1.0000 1.0000 1.0000 1.0000
DMU2 1.0000 1.0000 1.0000 1.0000 1.0000
DMU3 1.0000 1.0000 1.0000 1.0000 1.0000
DMU4 1.0000 1.0000 1.0000 1.0000 1.0000
DMU5 1.0000 1.0000 1.0000 1.0000 1.0000
几何平均 1.0000 1.0000 1.0000 1.0000 1.0000
           
Malmuist指数汇总结果      
DMUi 技术效率 技术变化 纯技术效率 规模效率 生产率
DMU1 0.8660 1.1547 1.0000 0.8660 1.0000
DMU2 1.0607 1.1547 1.1055 0.9594 1.2247
DMU3 1.0000 1.1547 1.0000 1.0000 1.1547
DMU4 0.7500 1.1547 0.8062 0.9303 0.8660
DMU5 0.9487 1.1547 1.0000 0.9487 1.0955
几何平均 0.9185 1.1547 0.9773 0.9398 1.0605

 

 Cell Clipboard</font>

 

 

      

       数据包络分析C2R模型和BC2模型分析功能加入到DPS之中(2007.04.18, 5月17日更新C2R模型)

       【作者按:许多搞经济统计分析的DPS用户,一直催着我将数据包络分析和随机前沿面模型分析内容加入到DPS中来,因精力有限、且学习相关方法需要时间,故直到今天才完成该项工作,在此对 我们的DPS用户朋友深表歉意。通过对数据包络分析和随机前沿面模型分析内容的学习、了解,发现它们在经济分析中确实有用,且两种方法各有长处,可互为补充。并祝愿搞经济统计分析的DPS用户朋友,应用数据包络分析和随机前沿面模型分析多出成果。】

       这里以数据包络分析C2R模型分析 为例介绍其使用方法:数据编辑格式,一行放一个决策单元(DMU),一行中左边放该决策单元的输入数据,右边放输出数据。数据编辑格式如下图阴影部分所示:

    在DPS的“专业统计”中的“计量经济”子菜单下面执行“数据包络分析”分析,系统显示用户工作界面如上图下部,在对话框中键入“输出变量个数”,再点击“OK”则得到结果如下(这里分析所用的是参考文献1中的例子,其结果 的详细分析、解释可见参考文献1参考文献2):

计算结果 当前日期 2007-4-18 22:22:56        
DMUi 相对效率 X1权重 X2权重 X3权重 Y1权重 Y2权重 Y3权重 Y4权重
DMU1 1.0000 0.0000 0.0057 0.0024 0.0125 0.0000 0.0000 0.0000
DMU2 0.8982 0.0143 0.0000 0.0000 0.0000 0.0554 0.0071 0.0000
DMU3 1.0000 0.0000 0.0064 0.0000 0.0111 0.0000 0.0000 0.0000
DMU4 0.8206 0.0000 0.0014 0.0073 0.0000 0.0442 0.0000 0.0138
DMU5 1.0000 0.0000 0.0041 0.0189 0.0025 0.1155 0.0000 0.0000
                 
S*                
DMU1 1.0000 0.0000 0.0000 0.0000 0.0000      
DMU2 0.8472 0.0000 0.1417 0.0000 0.0000      
DMU3 0.0000 0.0000 1.0000 0.0000 0.0000      
DMU4 1.0964 0.0000 0.0536 0.0000 0.3464      
DMU5 0.0000 0.0000 0.0000 0.0000 1.0000      
                 
非有效性DMUi的优化          
DMUi x1 x2 x3 y1 y2 y3 y4  
DMU2 62.8750 154.4083 56.5278 80.5278 13.0000 25.0000 4.0972  
DMU4 82.4636 215.8215 70.5728 102.9272 17.0000 31.4454 5.0000  
                 
S*- DMU1 DMU2 DMU3 DMU4 DMU5      
x1 0.0000 0.0000 0.0000 4.5215 0.0000      
x2 0.0000 25.2345 0.0000 0.0000 0.0000      
x3 0.0000 105.1508 0.0000 0.0000 0.0000      
                 
S*+ DMU1 DMU2 DMU3 DMU4 DMU5      
y1 0.0000 20.5278 0.0000 6.9272 0.0000      
y2 0.0000 0.0000 0.0000 0.0000 0.0000      
y3 0.0000 0.0000 0.0000 3.4454 0.0000      
y4 0.0000 2.0972 0.0000 0.0000 0.0000      

 

 

    应用C2R和BC2模型进行效益的分析和排序,虽然DEA对非有效的决策单元(DMU)能够提供很多信息,但对有效的DMU所提供信息很少,很多情形下其效率值均为1,而失去了根据效率值进行 综合评价分析和排序的初衷。DPS统计软件用户、淮阴师范学院的何伟先生建议将Andersen和Petersen对数据包络分析模型提出的改进方法(见参考文献3)放到DPS系统中,使得各个DMU的效率值均有所差别,这样便于 综合评价分析及排序。我们采纳了何先生的建议,将该方法加入进来,现在DPS系统里面的数据包络分析功能的新的用户界面如下(2007.05.17):

 

 

上面例子,应用改进的CCR模型,得到计算结果如下(现在非常适合于评价、排序之研究了 ^_^  ):

 Cell Clipboard</font>
DMUi 相对效率
DMU1 1.6961
DMU2 0.8982
DMU3 1.6560
DMU4 0.8206
DMU5 1.1290

 

 

    

       随机前沿面模型分析及面板数据统计分析功能加入到DPS之中(2007.04.12)

       随机前沿面模型分析的数据编辑格式如下:

 

                                 xi1, xi2, ..., xim, yi

           或

                               单位编号,时期编号,xi1,xi2,...,xim,yi

 

      如果数据还含有p个表示时间变化趋势的变量z(这时为面板数据Panel data模型分析),这时数据编辑、定义格式为:

 

                               单位编号,时期编号,xi1,xi2,...,xim,zi1,zi2,...,zip,yi

 

      该功能在“专业统计”中的“计量经济”子菜单下面。

      有人对医院的效率进行了综合评价,评价体系有4个输入指标,输出指标 为医疗收入。分析时数据格式编辑如下图上部:      

        在DPS的“专业统计”中的“计量经济”子菜单下面执行“随机前沿面模型”分析,系统显示用户工作界面如上图 下面所示,该问题是应用该模块的最基本功能,点击“确定”按钮后得到结果如下:

误差组分前沿面, 生产函数模型        
因变量未取对数          
OLS估计值:              
项目 系数 标准误 T值 P值      
β0 -92.5178 96.6465 -0.9573 0.3754      
β1 0.8210 0.5205 1.5772 0.1658      
β2 0.3938 0.4041 0.9746 0.3674      
β3 0.0210 0.2471 0.0851 0.9350      
β4 0.1917 0.6723 0.2852 0.7851      
σ-SQUARED 4158.1055            
对数似然函数 -58.1051            
               
网格搜索估计值:            
β0 -30.3404            
β1 0.8210            
β2 0.3938            
β3 0.0210            
β4 0.1917            
σ^2 6134.0892            
γ 0.9900            
μ被限制于0              
η被限制于0              
Iter=0 对数似然函数=-57.473318          
-30.3404 0.8210 0.3938 0.0210 0.1917 6134.0892 0.9900  
梯度步长              
Iter=5 对数似然函数=-56.074462          
-30.3413 0.8581 0.3611 -0.0147 0.3111 6134.0892 1.0000  
Iter=10 对数似然函数=-55.358895          
-30.3467 1.0453 0.1171 -0.0569 0.4338 6134.0890 1.0000  
Iter=15 对数似然函数=-55.283964          
-30.3515 1.0720 0.0637 -0.0565 0.4516 6134.0889 1.0000  
Iter=18 对数似然函数=-55.282266          
-30.3516 1.0726 0.0626 -0.0565 0.4520 6134.0889 1.0000  
极大似然估计结果:            
项目 系数 标准误 T值 p-值      
β0 -30.3516 1.0033 -30.2520 0.0001      
β1 1.0726 0.2934 3.6559 0.0106      
β2 0.0626 0.6034 0.1037 0.9208      
β3 -0.0565 0.0151 -3.7306 0.0097      
β4 0.4520 0.1978 2.2849 0.0624      
σ^2 6134.0889 1.0000 6134.0826        
γ