|
多年多点品比区试AMMI模型增加到DPS系统中(2008.09.21)
应广大用户的迫切要求,我们将多年多点的品种比较区域试验的AMMI模型分析技术增加到DPS系统之中。统计分析数据格式按年份、地点、品种的次序排列(如下图):
图中是2个年份、3个地点、3个品种、4次重复例子数据。选中数据后,在“专业统计”下面的“品种区试”里面,执行“多年多点AMMI模型分析”,即可得到分析结果:
|
平均产量两向列表 |
|
|
|
2001.625 |
1984.875 |
2148.25 |
|
|
|
|
2201 |
2277.375 |
2572 |
|
|
|
|
2065.875 |
1730.75 |
1689.25 |
|
|
|
|
注:列表示品种(基因), 行表示地点(环境) |
|
| |
|
|
|
|
|
| |
|
|
|
|
|
|
离差两向列表 |
|
|
|
|
|
-58.236 |
16.847 |
41.389 |
|
|
|
|
-164.069 |
4.139 |
159.931 |
|
|
|
|
222.306 |
-20.986 |
-201.319 |
|
|
|
|
注:列表示品种(基因), 行表示地点(环境) |
|
| |
|
|
|
|
|
| |
表2 品种试验方差分析表 |
|
|
|
变异来源 |
DF |
SS |
MS |
F-value |
Prob. |
|
总的 |
71 |
39585692 |
557544.95 |
|
|
|
处理 |
17 |
34889793 |
2052340.8 |
23.600678 |
0 |
|
年份 |
1 |
3495368 |
3495368 |
40.194619 |
0 |
|
基因 |
2 |
239336.44 |
119668.22 |
1.3761122 |
0.261272 |
|
环境 |
2 |
3295171.7 |
1647585.8 |
18.946241 |
0.000001 |
|
V×E交互作用 |
4 |
1186333.6 |
296583.41 |
3.4105299 |
0.014724 |
|
V×Y交互作用 |
2 |
7478299 |
3739149.5 |
42.997959 |
0 |
|
E×Y交互作用 |
2 |
11809519 |
5904759.3 |
67.901163 |
0 |
|
V×E×Y交互作用 |
4 |
7385765.4 |
1846441.4 |
21.232959 |
0 |
|
误差 |
54 |
4695899 |
86961.093 |
|
|
| |
|
|
|
|
|
|
以下为基因×环境交互作用效应的AMMI模型分析 |
|
|
| |
|
|
|
|
|
| |
线性回归模型分析结果 |
|
|
变量 |
均值 |
离差 |
斜率 |
r^2(%) |
|
|
品种1 |
2089.5 |
14.9444 |
0.28508 |
88.02 |
|
|
品种2 |
1997.667 |
-76.8889 |
1.04226 |
33.08 |
|
|
品种3 |
2136.5 |
61.9444 |
1.67266 |
91.6 |
|
|
环境1 |
2044.917 |
-29.6389 |
1.03992 |
0.3 |
|
|
环境2 |
2350.125 |
275.5694 |
1.71564 |
9.73 |
|
|
环境3 |
1828.625 |
-245.9306 |
0.24443 |
6.3 |
|
|
联合回归系数=0.00278111 |
|
|
| |
|
|
|
|
|
| |
表 品比试验结果线性回归分析 |
|
变异来源 |
df |
SS |
MS |
F |
Prob. |
|
总的 |
71 |
39585692 |
557544.95 |
|
|
|
处理 |
17 |
34889793 |
2052340.8 |
23.600678 |
0 |
|
基因 |
2 |
239336.44 |
119668.22 |
1.3761122 |
0.261272 |
|
环境 |
2 |
3295171.7 |
1647585.8 |
18.946241 |
0.000001 |
|
交互作用 |
4 |
1186333.6 |
296583.41 |
3.4105299 |
0.014724 |
|
联合回归 |
1 |
42360.525 |
42360.525 |
0.4871204 |
0.488209 |
|
基因回归 |
1 |
487820.4 |
487820.4 |
5.6096397 |
0.02147 |
|
环境回归 |
1 |
904.42035 |
904.42035 |
0.0104003 |
0.919149 |
|
残差 |
1 |
655248.3 |
655248.3 |
7.5349593 |
0.0082 |
|
误差 |
54 |
4695899 |
86961.093 |
|
|
| |
|
|
|
|
|
| |
表 品比试验结果AMMI分析 |
|
变异来源 |
df |
SS |
MS |
F |
Prob. |
|
总的 |
71 |
39585692 |
557544.95 |
|
|
|
处理 |
17 |
34889793 |
2052340.8 |
23.600678 |
0 |
|
基因 |
2 |
239336.44 |
119668.22 |
1.3761122 |
0.261272 |
|
环境 |
2 |
3295171.7 |
1647585.8 |
18.946241 |
0.000001 |
|
交互作用 |
4 |
1186333.6 |
296583.41 |
3.4105299 |
0.014724 |
|
PCA1 |
3 |
591617.35 |
197205.78 |
0.3315964 |
0.8025149 |
|
残差 |
1 |
594716.29 |
594716.29 |
|
|
|
误差 |
54 |
4695899 |
86961.093 |
|
|
|
变量 |
产量平均 |
离差 |
PCA1 |
特征向量1 |
|
|
品种1 |
2089.5 |
14.9444 |
-14.39397 |
-0.73398 |
|
|
品种2 |
1997.6667 |
-76.8889 |
1.12229 |
0.05723 |
|
|
品种3 |
2136.5 |
61.9444 |
13.27168 |
0.67675 |
|
| |
|
|
|
|
|
|
环境1 |
2044.9167 |
-29.6389 |
-3.65709 |
-0.18648 |
|
|
环境2 |
2350.125 |
275.5694 |
-11.67186 |
-0.59518 |
|
|
环境3 |
1828.625 |
-245.9306 |
15.32895 |
0.78166 |
|
| |
|
|
|
|
|
|
AMMI0模型拟合两向列表 |
|
|
|
|
2059.861 |
1968.028 |
2106.861 |
|
|
|
|
2365.069 |
2273.236 |
2412.069 |
|
|
|
|
1843.569 |
1751.736 |
1890.569 |
|
|
|
|
注:列表示品种(基因), 行表示地点(环境) |
|
| |
|
|
|
|
|
| |
|
|
|
|
|
|
AMMI1模型拟合两向列表 |
|
|
|
|
2112.501 |
1963.923 |
2058.325 |
|
|
|
|
2533.074 |
2260.137 |
2257.164 |
|
|
|
|
1622.925 |
1768.94 |
2094.01 |
|
|
|
|
注:列表示品种(基因), 行表示地点(环境) |
|
模糊隶属度计算,模糊风险评价功能增加到DPS企业版中(2008.08.07).
DPS统计软件企业版本年度重大进展:多变量方差分析的一般线性模型方法增加到DPS v10.15之中(2008.05.25) 。
DPS企业版10.15的一般线性模型,除原来可进行单变量方差分析外,增加了多变量方差分析
、重复测量方差分析功能。使得一般线性模型(GLM)具备了更加完善、强大的统计检验功能。
多变量方差分析,目前国内应用尚少。在CNKI里面,用“方差分析”作为关键词检索,可检出8048条;但用“多元方差分析”或“多变量方差分析”作为关键词检索,总共仅检出158条;相比之下,多元方差分析的应用明显偏少(不到前者的2%),这可能与多元方差分析计算复杂
、繁重(手工根本无法计算),且供分析使用的统计软件不多、一般统计软件的可操作性不是很好等因素限制了它的应用有关。
现在,我们的DPS提供的一般线性模型多变量方差分析功能,用户操作直观、并可以处理各种类型试验设计的多变量方差分析问题,特别是一些用SPSS菜单操作解决不了、用SAS编程很难折腾的多变量的嵌套设计、交叉设计、多因素裂区混杂设计、格子设计
、协方差分析等所有的试验设计的多元方差分析问题。应用DPS提供的多变量方差分析一般线性模型,
可在菜单操作方式下轻松完成。
该功能在“试验统计”-“一般线性模型”下面,其用户界面和单变量方差分析的一般线性模型相同,示例如下:

本例数据分析结果示例如下:
|
各个处理因子所含类目列表 |
|
|
|
|
|
施氮量: |
少(3) |
中(5) |
多(4) |
|
|
|
|
|
|
施P量: |
少(7) |
多(5) |
|
|
|
|
|
|
|
施K量: |
少(7) |
多(5) |
|
|
|
|
|
|
|
括号内是该类目的样本数。 |
|
|
|
|
| |
|
|
|
|
|
|
|
|
|
以各个处理因子的最后一个类目作为参照。 |
|
|
|
|
|
编码方式 |
效应编码(适合于方差分析) |
|
|
|
| |
方差分析表(III型平方和分解) |
|
|
|
| |
|
|
|
|
|
|
|
|
|
施氮量 |
|
|
|
|
|
|
|
|
SSCP |
当年高y1 |
次生高y2 |
二年径y3 |
|
误差 |
当年高y1 |
次生高y2 |
二年径y3 |
|
当年高y1 |
0.0611 |
0.1843 |
0.3495 |
|
当年高y1 |
0.2555 |
0.0521 |
0.4237 |
|
次生高y2 |
0.1843 |
0.5632 |
1.0398 |
|
次生高y2 |
0.0521 |
0.0867 |
0.2056 |
|
二年径y3 |
0.3495 |
1.0398 |
2.0247 |
|
二年径y3 |
0.4237 |
0.2056 |
1.1322 |
| |
|
|
|
|
|
|
|
|
|
项目 (施氮量) 的方差分析 |
|
|
|
|
|
|
|
|
显著性整体检验 |
|
|
|
|
|
|
|
|
Wilk's Λ |
F值 |
df1 |
df2 |
p值 |
|
|
|
|
|
0.0966 |
3.6946 |
6.0000 |
10.0000 |
0.0336 |
|
|
|
|
| |
|
|
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|
|
变量 |
类别 |
理论均值 |
样本均值 |
标准差 |
样本数 |
|
|
|
|
当年高y1 |
少 |
1.9959 |
1.9700 |
0.3236 |
3.0000 |
|
|
|
|
当年高y1 |
中 |
2.1495 |
2.1340 |
0.0786 |
5.0000 |
|
|
|
|
当年高y1 |
多 |
2.1750 |
2.1750 |
0.1358 |
4.0000 |
|
|
|
|
次生高y2 |
少 |
1.7456 |
1.7500 |
0.0458 |
3.0000 |
|
|
|
|
次生高y2 |
中 |
2.1754 |
2.1780 |
0.1055 |
5.0000 |
|
|
|
|
次生高y2 |
多 |
2.3100 |
2.3100 |
0.1273 |
4.0000 |
|
|
|
|
二年径y3 |
少 |
3.7463 |
3.7333 |
0.4726 |
3.0000 |
|
|
|
|
二年径y3 |
中 |
4.6878 |
4.6800 |
0.3033 |
5.0000 |
|
|
|
|
二年径y3 |
多 |
4.7250 |
4.7250 |
0.3304 |
4.0000 |
|
|
|
| |
|
|
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|
|
Roy's T-Square, 下三角为统计量,上三角为p值 |
|
|
|
|
|
F(3,5) |
施氮量1 |
施氮量2 |
施氮量3 |
|
|
|
|
|
|
施氮量1 |
|
0.0319 |
0.0120 |
|
|
|
|
|
|
施氮量2 |
6.8578 |
|
0.3260 |
|
|
|
|
|
|
施氮量3 |
11.0672 |
1.4830 |
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|
|
单变量分析 |
|
|
|
|
|
|
|
|
|
变量 |
平方和 |
自由度 |
均方 |
F值 |
p值 |
备注 |
|
|
当年高y1 |
0.0611 |
2.0000 |
0.0306 |
0.8376 |
0.4719 |
施氮量 |
|
|
|
次生高y2 |
0.5632 |
2.0000 |
0.2816 |
22.7289 |
0.0009 |
施氮量 |
|
|
|
二年径y3 |
2.0247 |
2.0000 |
1.0123 |
6.2591 |
0.0276 |
施氮量 |
|
|
| |
|
|
|
|
|
|
|
|
|
施P量 |
|
|
|
|
|
|
|
|
SSCP |
当年高y1 |
次生高y2 |
二年径y3 |
|
误差 |
当年高y1 |
次生高y2 |
二年径y3 |
|
当年高y1 |
0.0118 |
-0.0098 |
0.0102 |
|
当年高y1 |
0.2555 |
0.0521 |
0.4237 |
|
次生高y2 |
-0.0098 |
0.0081 |
-0.0085 |
|
次生高y2 |
0.0521 |
0.0867 |
0.2056 |
|
二年径y3 |
0.0102 |
-0.0085 |
0.0089 |
|
二年径y3 |
0.4237 |
0.2056 |
1.1322 |
| |
|
|
|
|
|
|
|
|
|
项目 (施P量) 的方差分析 |
|
|
|
|
|
|
|
|
显著性整体检验 |
|
|
|
|
|
|
|
|
Wilk's Λ |
F值 |
df1 |
df2 |
p值 |
|
|
|
|
|
0.8036 |
0.4072 |
3.0000 |
5.0000 |
0.7549 |
|
|
|
|
| |
|
|
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|
|
变量 |
类别 |
理论均值 |
样本均值 |
标准差 |
样本数 |
|
|
|
|
当年高y1 |
少 |
2.0747 |
2.0743 |
0.2231 |
7.0000 |
|
|
|
|
当年高y1 |
多 |
2.1389 |
2.1520 |
0.1134 |
5.0000 |
|
|
|
|
次生高y2 |
少 |
2.1036 |
2.1157 |
0.2692 |
7.0000 |
|
|
|
|
次生高y2 |
多 |
2.0504 |
2.1140 |
0.2419 |
5.0000 |
|
|
|
|
二年径y3 |
少 |
4.3585 |
4.4000 |
0.6583 |
7.0000 |
|
|
|
|
二年径y3 |
多 |
4.4142 |
4.5400 |
0.3847 |
5.0000 |
|
|
|
| |
|
|
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|
|
单变量分析 |
|
|
|
|
|
|
|
|
|
变量 |
平方和 |
自由度 |
均方 |
F值 |
p值 |
备注 |
|
|
当年高y1 |
0.0118 |
1.0000 |
0.0118 |
0.3233 |
0.5874 |
施P量 |
|
|
|
次生高y2 |
0.0081 |
1.0000 |
0.0081 |
0.6527 |
0.4457 |
施P量 |
|
|
|
二年径y3 |
0.0089 |
1.0000 |
0.0089 |
0.0549 |
0.8215 |
施P量 |
|
|
| |
|
|
|
|
|
|
|
|
|
施K量 |
|
|
|
|
|
|
|
|
SSCP |
当年高y1 |
次生高y2 |
二年径y3 |
|
误差 |
当年高y1 |
次生高y2 |
二年径y3 |
|
当年高y1 |
0.0236 |
0.0070 |
0.0058 |
|
当年高y1 |
0.2555 |
0.0521 |
0.4237 |
|
次生高y2 |
0.0070 |
0.0021 |
0.0017 |
|
次生高y2 |
0.0521 |
0.0867 |
0.2056 |
|
二年径y3 |
0.0058 |
0.0017 |
0.0014 |
|
二年径y3 |
0.4237 |
0.2056 |
1.1322 |
| |
|
|
|
|
|
|
|
|
|
项目 (施K量) 的方差分析 |
|
|
|
|
|
|
|
|
显著性整体检验 |
|
|
|
|
|
|
|
|
Wilk's Λ |
F值 |
df1 |
df2 |
p值 |
|
|
|
|
|
0.7516 |
0.5507 |
3.0000 |
5.0000 |
0.6694 |
|
|
|
|
| |
|
|
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|
|
变量 |
类别 |
理论均值 |
样本均值 |
标准差 |
样本数 |
|
|
|
|
当年高y1 |
少 |
2.0613 |
2.0629 |
0.2277 |
7.0000 |
|
|
|
|
当年高y1 |
多 |
2.1522 |
2.1680 |
0.0782 |
5.0000 |
|
|
|
|
次生高y2 |
少 |
2.0636 |
2.0814 |
0.2650 |
7.0000 |
|
|
|
|
次生高y2 |
多 |
2.0904 |
2.1620 |
0.2390 |
5.0000 |
|
|
|
|
二年径y3 |
少 |
4.3752 |
4.4143 |
0.6694 |
7.0000 |
|
|
|
|
二年径y3 |
多 |
4.3976 |
4.5200 |
0.3633 |
5.0000 |
|
|
|
| |
|
|
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|
|
单变量分析 |
|
|
|
|
|
|
|
|
|
变量 |
平方和 |
自由度 |
均方 |
F值 |
p值 |
备注 |
|
|
当年高y1 |
0.0236 |
1.0000 |
0.0236 |
0.6475 |
0.4475 |
施K量 |
|
|
|
次生高y2 |
0.0021 |
1.0000 |
0.0021 |
0.1662 |
0.6957 |
施K量 |
|
|
|
二年径y3 |
0.0014 |
1.0000 |
0.0014 |
0.0088 |
0.9277 |
施K量 |
|
|
| |
|
|
|
|
|
|
|
|
|
项目 (误差项) 的方差分析 |
|
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|
|
单变量分析 |
|
|
|
|
|
|
|
|
|
变量 |
平方和 |
自由度 |
均方 |
|
|
|
|
|
|
当年高y1 |
0.2555 |
7.0000 |
0.0365 |
|
|
|
|
|
|
次生高y2 |
0.0867 |
7.0000 |
0.0124 |
|
|
|
|
|
|
二年径y3 |
1.1322 |
7.0000 |
0.1617 |
|
|
|
|
|
序贯试验及成组序贯试验统计分析增加到DPS v10.01之中(2008.05.08) 。
序贯试验(sequential trials)是一类边实验、边统计的方法,按照实验样本进入试验次序,每得到一例或一个阶段观察结果就进行一次统计分析。
序贯试验的特点是根据事先规定的假阳性率、假阴性率和试验标准,绘制有效、无效界线,或者确定检验界限值,当实验结果触及界限即停止试验,作出统计推论。因此应用序贯试验可节省样本含量和缩短试验时间。
详细使用说明可在此下载word文档。
DPS10.01企业版可以在Vista下面正常运行了(2008.04.18)
2008年以来,为适应用户新的需求、不断变化的新的使用环境及为DPS系统的长远发展着想,我们对DPS系统实施了两大改进工程:一是2008年1~2月实施的DPS系统中英文双语化
工程。二是2008年3~4月实施的电子工作表改造工程,即更换电子工作表。因原来ActiveX控件的电子工作表只有255列、65535行,
不能完全满足用户对数据量的要求(特别是数据列数过少,仅255列);且原来的工作表可能在Vista下面不完全兼容,而导致DPS在Vista下面有时不能用(但有的用户又可以在Vista下面正常使用)。这次新的电子表格是Delphi控件,其容纳数据的行列数均可达到数百万,且可完全编译到DPS的程序之中,因此目前版本的DPS系统无需安装,下载后即可使用。下载地址:中文版下载;英文版下载。
平衡不完全区组设计(Blanced Incomplete Block Design, BIBD)试验统计分析已加入到DPS10.01企业版中(2008.04.18)
方法简介
当处理数较多时,或因条件限制,各试验处理不能同时进行时,需有计划地将几个处理安排在每个区组里,分析时就可将包含在处理间的区组效应及包含在区组间的处理间的影响消除掉,从而使处理间差别不受区组差别的影响。
平衡不完全区组试验设计有两个特点,一是每一处理在每个配伍组中最多出现一次,且出现总次数相同,即每一处理重复数都是r;其次是任两个处理出现在同一区组的次数相等。故平衡是指各处理间是平等,不完全是指每个区组只包括部分处理。
如共有a个处理,每个区组中有k个处理(k<a),b为区组数,r为每处理重复次数,λ为每两种处理同时出现的区组数,则个体总数等于n=ra=bk,λ=r(k-1)/(a-1)。平衡不完全区组的线性模型可表达如下:

这里yij是第j个区组的第i个观察值,m是总均值,ti是第i种处理的效应,bj是第j个区组的效应,eij是NID(0,s2)随机误差。显然,实验数据的总离差平方和SST等于 ,它又可分解为

式中处理平方和经过调整,以使得处理和区组效应得到分离。区组平方和和处理(已调整的)平方和计算公式为:
,
这里y.j是区组j的总和,SS区组有b-1个自由度。处理平方和调整公式中的Qi是第i个处理的已调整的总和

公式中nij的取值方法是:当区组j中出现处理i时取值为1,否则为0。这样算式 仅含有处理i的区组总和的平均。SS处理(已调整的)有a-1个自由度。
最后由平方和分解公式,可得到误差平方和SSE=SST-
SS处理(已调整的)-
SS区组,自由度为N-a-b+1。
根据这几项平方和的分解,我们不难列出方差分析表1。
但当我们更关注区组效应时(这种情形很少),也可对区组效应进行类似调整,以对区组效应进行统计检验,区组效应调整公式是:

因误差平方项 不变,故依平方和分解公式可得到SS处理的平方和。同样,根据这几项平方和的分解,不难列出检验区组(已调整过的)效应的方差分析表2。
当方差分析表1通过检验,处理效应显著时,类似一般随机区组设计那样,可进一步进行多重比较。这时各个处理均值需要进行调整,调整均值 为:

多重比较统计检验的标准误S等于 。比较可用Tukey法、LSD法等方法进行。
上述分析通常叫做内部区组分析(intrablock
analysis),是平衡不完全区组设计的基本分析方法。Yates(1940)注意到,若区组效应是均值为零、方差为 的不相关随机变量时,可进一步提取处理效应ti的附加信息,即进行中介区组分析(interblock
analysis)。中介区组估计公式为:

进一步,可将中介区组估计和内部区组估计合并,以得到一个单个的、无偏且最小方差的估计量(组合估计量,combine
estimate),即 。许多人对其组合权重进行了研究,经推导估计公式是:

式中,方差 和 是 和 的估计值,因 和 未知, 通常取内部方差分析中的误差均方,即 =MSE。 的估计值根据对区组已调整过的均方值计算,公式是

应用示例
例如要比较五种工艺,分配给10个工厂进行试验,每个工厂答应承担试验三种工艺。因此,a=5,b=10,k=3。
将各个处理排成k列b行,各个处理用A、B、C、D、E,…等英文字母表示,在各个处理的英文字母代号后面可放入该处理的试验结果。本例数据进行平衡不完全区组试验结果分析时,先将数据定义成数据块(图4-10阴影部分)。

平衡不完全区组试验分析数据格式
编辑、选择数据之后,在DPS菜单方式下,执行试验统计->随机区组设计->平衡不完全区组试验设计分析。分析时选择多重比较方法,然后得到计算结果如下:
|
|
表
方差分析表(1) |
|
|
|
变异来源 |
平方和 |
自由度 |
均方 |
F值 |
p值 |
|
区组间 |
2458.503 |
9 |
273.167 |
|
|
|
处理间(Adj.) |
1575.328 |
4 |
393.832 |
7.0081 |
0.0019 |
|
误差 |
899.152 |
16 |
56.197 |
|
|
|
总变异 |
4932.983 |
29 |
|
|
| |