Refine Information Tech. Co., LtD

往年新增内容:2007年 2006年 2005年 2004年 2003年 2002年 2001年 

     多年多点品比区试AMMI模型增加到DPS系统中(2008.09.21)

     应广大用户的迫切要求,我们将多年多点的品种比较区域试验的AMMI模型分析技术增加到DPS系统之中。统计分析数据格式按年份、地点、品种的次序排列(如下图):

    图中是2个年份、3个地点、3个品种、4次重复例子数据。选中数据后,在“专业统计”下面的“品种区试”里面,执行“多年多点AMMI模型分析”,即可得到分析结果:

平均产量两向列表     
2001.625 1984.875 2148.25      
2201 2277.375 2572      
2065.875 1730.75 1689.25      
注:列表示品种(基因), 行表示地点(环境)   
           
           
离差两向列表         
-58.236 16.847 41.389      
-164.069 4.139 159.931      
222.306 -20.986 -201.319      
注:列表示品种(基因), 行表示地点(环境)   
           
  表2  品种试验方差分析表     
变异来源 DF SS MS F-value Prob.
总的 71 39585692 557544.95    
处理 17 34889793 2052340.8 23.600678 0
年份 1 3495368 3495368 40.194619 0
基因 2 239336.44 119668.22 1.3761122 0.261272
环境 2 3295171.7 1647585.8 18.946241 0.000001
V×E交互作用 4 1186333.6 296583.41 3.4105299 0.014724
V×Y交互作用 2 7478299 3739149.5 42.997959 0
E×Y交互作用 2 11809519 5904759.3 67.901163 0
V×E×Y交互作用 4 7385765.4 1846441.4 21.232959 0
误差 54 4695899 86961.093    
           
以下为基因×环境交互作用效应的AMMI模型分析     
           
  线性回归模型分析结果   
变量 均值 离差 斜率 r^2(%)  
品种1 2089.5 14.9444 0.28508 88.02  
品种2 1997.667 -76.8889 1.04226 33.08  
品种3 2136.5 61.9444 1.67266 91.6  
环境1 2044.917 -29.6389 1.03992 0.3  
环境2 2350.125 275.5694 1.71564 9.73  
环境3 1828.625 -245.9306 0.24443 6.3  
联合回归系数=0.00278111     
           
  表     品比试验结果线性回归分析 
变异来源 df SS MS F Prob.
总的 71 39585692 557544.95    
处理 17 34889793 2052340.8 23.600678 0
基因 2 239336.44 119668.22 1.3761122 0.261272
环境 2 3295171.7 1647585.8 18.946241 0.000001
交互作用 4 1186333.6 296583.41 3.4105299 0.014724
联合回归 1 42360.525 42360.525 0.4871204 0.488209
基因回归 1 487820.4 487820.4 5.6096397 0.02147
环境回归 1 904.42035 904.42035 0.0104003 0.919149
残差 1 655248.3 655248.3 7.5349593 0.0082
误差 54 4695899 86961.093    
           
  表     品比试验结果AMMI分析 
变异来源 df SS MS F Prob.
总的 71 39585692 557544.95    
处理 17 34889793 2052340.8 23.600678 0
基因 2 239336.44 119668.22 1.3761122 0.261272
环境 2 3295171.7 1647585.8 18.946241 0.000001
交互作用 4 1186333.6 296583.41 3.4105299 0.014724
PCA1 3 591617.35 197205.78 0.3315964 0.8025149
残差 1 594716.29 594716.29    
误差 54 4695899 86961.093    
变量 产量平均 离差 PCA1 特征向量1  
品种1 2089.5 14.9444 -14.39397 -0.73398  
品种2 1997.6667 -76.8889 1.12229 0.05723  
品种3 2136.5 61.9444 13.27168 0.67675  
           
环境1 2044.9167 -29.6389 -3.65709 -0.18648  
环境2 2350.125 275.5694 -11.67186 -0.59518  
环境3 1828.625 -245.9306 15.32895 0.78166  
           
AMMI0模型拟合两向列表       
2059.861 1968.028 2106.861      
2365.069 2273.236 2412.069      
1843.569 1751.736 1890.569      
注:列表示品种(基因), 行表示地点(环境)   
           
           
AMMI1模型拟合两向列表       
2112.501 1963.923 2058.325      
2533.074 2260.137 2257.164      
1622.925 1768.94 2094.01      
注:列表示品种(基因), 行表示地点(环境)   

    模糊隶属度计算,模糊风险评价功能增加到DPS企业版中(2008.08.07).
 

     DPS统计软件企业版本年度重大进展:多变量方差分析的一般线性模型方法增加到DPS v10.15之中(2008.05.25)

    DPS企业版10.15的一般线性模型,除原来可进行单变量方差分析外,增加了多变量方差分析 、重复测量方差分析功能。使得一般线性模型(GLM)具备了更加完善、强大的统计检验功能。

    多变量方差分析,目前国内应用尚少。在CNKI里面,用“方差分析”作为关键词检索,可检出8048条;但用“多元方差分析”或“多变量方差分析”作为关键词检索,总共仅检出158条;相比之下,多元方差分析的应用明显偏少(不到前者的2%),这可能与多元方差分析计算复杂 、繁重(手工根本无法计算),且供分析使用的统计软件不多、一般统计软件的可操作性不是很好等因素限制了它的应用有关。

    现在,我们的DPS提供的一般线性模型多变量方差分析功能,用户操作直观、并可以处理各种类型试验设计的多变量方差分析问题,特别是一些用SPSS菜单操作解决不了、用SAS编程很难折腾的多变量的嵌套设计、交叉设计、多因素裂区混杂设计、格子设计 、协方差分析等所有的试验设计的多元方差分析问题。应用DPS提供的多变量方差分析一般线性模型, 可在菜单操作方式下轻松完成。 该功能在“试验统计”-“一般线性模型”下面,其用户界面和单变量方差分析的一般线性模型相同,示例如下:

   本例数据分析结果示例如下:

各个处理因子所含类目列表         
施氮量: 少(3) 中(5) 多(4)          
施P量: 少(7) 多(5)            
施K量: 少(7) 多(5)            
括号内是该类目的样本数。         
                 
以各个处理因子的最后一个类目作为参照。         
编码方式 效应编码(适合于方差分析)       
  方差分析表(III型平方和分解)       
                 
施氮量               
SSCP 当年高y1 次生高y2 二年径y3   误差 当年高y1 次生高y2 二年径y3
当年高y1 0.0611 0.1843 0.3495   当年高y1 0.2555 0.0521 0.4237
次生高y2 0.1843 0.5632 1.0398   次生高y2 0.0521 0.0867 0.2056
二年径y3 0.3495 1.0398 2.0247   二年径y3 0.4237 0.2056 1.1322
                 
项目 (施氮量) 的方差分析               
显著性整体检验               
Wilk's Λ F值 df1 df2 p值        
0.0966 3.6946 6.0000 10.0000 0.0336        
                 
                 
变量 类别 理论均值 样本均值 标准差 样本数      
当年高y1 1.9959 1.9700 0.3236 3.0000      
当年高y1 2.1495 2.1340 0.0786 5.0000      
当年高y1 2.1750 2.1750 0.1358 4.0000      
次生高y2 1.7456 1.7500 0.0458 3.0000      
次生高y2 2.1754 2.1780 0.1055 5.0000      
次生高y2 2.3100 2.3100 0.1273 4.0000      
二年径y3 3.7463 3.7333 0.4726 3.0000      
二年径y3 4.6878 4.6800 0.3033 5.0000      
二年径y3 4.7250 4.7250 0.3304 4.0000      
                 
                 
Roy's T-Square, 下三角为统计量,上三角为p值         
F(3,5) 施氮量1 施氮量2 施氮量3          
施氮量1   0.0319 0.0120          
施氮量2 6.8578   0.3260          
施氮量3 11.0672 1.4830            
                 
单变量分析                
变量 平方和 自由度 均方 F值 p值 备注   
当年高y1 0.0611 2.0000 0.0306 0.8376 0.4719 施氮量    
次生高y2 0.5632 2.0000 0.2816 22.7289 0.0009 施氮量    
二年径y3 2.0247 2.0000 1.0123 6.2591 0.0276 施氮量    
                 
施P量               
SSCP 当年高y1 次生高y2 二年径y3   误差 当年高y1 次生高y2 二年径y3
当年高y1 0.0118 -0.0098 0.0102   当年高y1 0.2555 0.0521 0.4237
次生高y2 -0.0098 0.0081 -0.0085   次生高y2 0.0521 0.0867 0.2056
二年径y3 0.0102 -0.0085 0.0089   二年径y3 0.4237 0.2056 1.1322
                 
项目 (施P量) 的方差分析               
显著性整体检验               
Wilk's Λ F值 df1 df2 p值        
0.8036 0.4072 3.0000 5.0000 0.7549        
                 
                 
变量 类别 理论均值 样本均值 标准差 样本数      
当年高y1 2.0747 2.0743 0.2231 7.0000      
当年高y1 2.1389 2.1520 0.1134 5.0000      
次生高y2 2.1036 2.1157 0.2692 7.0000      
次生高y2 2.0504 2.1140 0.2419 5.0000      
二年径y3 4.3585 4.4000 0.6583 7.0000      
二年径y3 4.4142 4.5400 0.3847 5.0000      
                 
                 
单变量分析                
变量 平方和 自由度 均方 F值 p值 备注   
当年高y1 0.0118 1.0000 0.0118 0.3233 0.5874 施P量    
次生高y2 0.0081 1.0000 0.0081 0.6527 0.4457 施P量    
二年径y3 0.0089 1.0000 0.0089 0.0549 0.8215 施P量    
                 
施K量               
SSCP 当年高y1 次生高y2 二年径y3   误差 当年高y1 次生高y2 二年径y3
当年高y1 0.0236 0.0070 0.0058   当年高y1 0.2555 0.0521 0.4237
次生高y2 0.0070 0.0021 0.0017   次生高y2 0.0521 0.0867 0.2056
二年径y3 0.0058 0.0017 0.0014   二年径y3 0.4237 0.2056 1.1322
                 
项目 (施K量) 的方差分析               
显著性整体检验               
Wilk's Λ F值 df1 df2 p值        
0.7516 0.5507 3.0000 5.0000 0.6694        
                 
                 
变量 类别 理论均值 样本均值 标准差 样本数      
当年高y1 2.0613 2.0629 0.2277 7.0000      
当年高y1 2.1522 2.1680 0.0782 5.0000      
次生高y2 2.0636 2.0814 0.2650 7.0000      
次生高y2 2.0904 2.1620 0.2390 5.0000      
二年径y3 4.3752 4.4143 0.6694 7.0000      
二年径y3 4.3976 4.5200 0.3633 5.0000      
                 
                 
单变量分析                
变量 平方和 自由度 均方 F值 p值 备注   
当年高y1 0.0236 1.0000 0.0236 0.6475 0.4475 施K量    
次生高y2 0.0021 1.0000 0.0021 0.1662 0.6957 施K量    
二年径y3 0.0014 1.0000 0.0014 0.0088 0.9277 施K量    
                 
项目 (误差项) 的方差分析               
                 
单变量分析                
变量 平方和 自由度 均方          
当年高y1 0.2555 7.0000 0.0365          
次生高y2 0.0867 7.0000 0.0124          
二年径y3 1.1322 7.0000 0.1617          

序贯试验及成组序贯试验统计分析增加到DPS v10.01之中(2008.05.08)

           序贯试验(sequential trials)是一类边实验、边统计的方法,按照实验样本进入试验次序,每得到一例或一个阶段观察结果就进行一次统计分析。 序贯试验的特点是根据事先规定的假阳性率、假阴性率和试验标准,绘制有效、无效界线,或者确定检验界限值,当实验结果触及界限即停止试验,作出统计推论。因此应用序贯试验可节省样本含量和缩短试验时间。 详细使用说明可在此下载word文档。

DPS10.01企业版可以在Vista下面正常运行了(2008.04.18)

          2008年以来,为适应用户新的需求、不断变化的新的使用环境及为DPS系统的长远发展着想,我们对DPS系统实施了两大改进工程:一是2008年1~2月实施的DPS系统中英文双语化 工程。二是2008年3~4月实施的电子工作表改造工程,即更换电子工作表。因原来ActiveX控件的电子工作表只有255列、65535行, 不能完全满足用户对数据量的要求(特别是数据列数过少,仅255列);且原来的工作表可能在Vista下面不完全兼容,而导致DPS在Vista下面有时不能用(但有的用户又可以在Vista下面正常使用)。这次新的电子表格是Delphi控件,其容纳数据的行列数均可达到数百万,且可完全编译到DPS的程序之中,因此目前版本的DPS系统无需安装,下载后即可使用。下载地址:中文版下载英文版下载

平衡不完全区组设计(Blanced Incomplete Block Design, BIBD)试验统计分析已加入到DPS10.01企业版中(2008.04.18)

 方法简介

当处理数较多时,或因条件限制,各试验处理不能同时进行时,需有计划地将几个处理安排在每个区组里,分析时就可将包含在处理间的区组效应及包含在区组间的处理间的影响消除掉,从而使处理间差别不受区组差别的影响。

平衡不完全区组试验设计有两个特点,一是每一处理在每个配伍组中最多出现一次,且出现总次数相同,即每一处理重复数都是r;其次是任两个处理出现在同一区组的次数相等。故平衡是指各处理间是平等,不完全是指每个区组只包括部分处理。

如共有a个处理,每个区组中有k个处理(ka),b为区组数,r为每处理重复次数,λ为每两种处理同时出现的区组数,则个体总数等于n=ra=bkλ=r(k-1)/(a-1)。平衡不完全区组的线性模型可表达如下:

这里yij是第j个区组的第i个观察值,m是总均值,ti是第i种处理的效应,bj是第j个区组的效应,eijNID(0,s2)随机误差。显然,实验数据的总离差平方和SST等于,它又可分解为

式中处理平方和经过调整,以使得处理和区组效应得到分离。区组平方和和处理(已调整的)平方和计算公式为:

这里y.j是区组j的总和,SS区组b-1个自由度。处理平方和调整公式中的Qi是第i个处理的已调整的总和

公式中nij的取值方法是:当区组j中出现处理i时取值为1,否则为0。这样算式仅含有处理i的区组总和的平均。SS处理(已调整的)a-1个自由度。

最后由平方和分解公式,可得到误差平方和SSE=SST- SS处理(已调整的)- SS区组,自由度为N-a-b+1

根据这几项平方和的分解,我们不难列出方差分析表1

但当我们更关注区组效应时(这种情形很少),也可对区组效应进行类似调整,以对区组效应进行统计检验,区组效应调整公式是:

因误差平方项不变,故依平方和分解公式可得到SS处理的平方和。同样,根据这几项平方和的分解,不难列出检验区组(已调整过的)效应的方差分析表2

当方差分析表1通过检验,处理效应显著时,类似一般随机区组设计那样,可进一步进行多重比较。这时各个处理均值需要进行调整,调整均值为:

多重比较统计检验的标准误S等于。比较可用Tukey法、LSD法等方法进行。

上述分析通常叫做内部区组分析(intrablock analysis),是平衡不完全区组设计的基本分析方法。Yates(1940)注意到,若区组效应是均值为零、方差为的不相关随机变量时,可进一步提取处理效应ti的附加信息,即进行中介区组分析(interblock analysis)。中介区组估计公式为:

进一步,可将中介区组估计和内部区组估计合并,以得到一个单个的、无偏且最小方差的估计量(组合估计量,combine estimate),。许多人对其组合权重进行了研究,经推导估计公式是:

式中,方差的估计值,因未知,通常取内部方差分析中的误差均方,即MSE的估计值根据对区组已调整过的均方值计算,公式是

 应用示例

例如要比较五种工艺,分配给10个工厂进行试验,每个工厂答应承担试验三种工艺。因此,a=5b=10k=3

将各个处理排成kb行,各个处理用ABCDE等英文字母表示,在各个处理的英文字母代号后面可放入该处理的试验结果。本例数据进行平衡不完全区组试验结果分析时,先将数据定义成数据块(4-10阴影部分)

                                                              平衡不完全区组试验分析数据格式

编辑、选择数据之后,在DPS菜单方式下,执行试验统计->随机区组设计->平衡不完全区组试验设计分析。分析时选择多重比较方法,然后得到计算结果如下: 

 

     方差分析表(1)

 

 

变异来源

平方和

自由度

均方

F

p

区组间

2458.503

9

273.167

 

 

处理间(Adj.)

1575.328

4

393.832

7.0081

0.0019

误差

899.152

16

56.197

 

 

总变异

4932.983

29