|
1.为什么将DPS软件取名为"dps数据处理系统"?
DPS开发的初衷就不仅限于统计分析,而是包括实验设计,统计分析,数据挖掘,预测决策,系统优化等有关数据处理的工作.因此这样取名. |
|
|
2. DPS配套专著的书名为什么要加上英文名称?
版主从中外期刊引文索引(如SCI)中发现,目前已有很多专家、学者将DPS用于科学研究,在国内外学术刊物上发表论文。因第一版没有给出英文书名,故参考文献的英译名不统一。
下面是2007年新版配套专著的英文书名,供大家在参考文献中引用:
Tang,Q.Y. and
Feng, M.G. 2007.
DPS Data processing system:
Experimental design, statistical
analysis, and data mining. Beijing: Science Press. |
|
3.
为什么传统的部分实施的“二次回归通用旋转设计”统计分析计算有问题?
如按目前国内有关试验设计统计专著介绍的方法进行分析,由于计矩阵的二次多项式不是严格正交的,故计算结果不是很“准确”。将4(1/2)设计,由于设计矩阵的二次多项式的几个互作项,即x1x2和x3x4、x1x3和x2x4、x1x4和x2x3之间线性相关,实际上是存在混杂,这时按目前介绍的统计分析方法计算的结果,就会出现差错,这样接下来的回归方程的统计检验、拟合值,及其模拟预测值均是错的了。
版主目前在DPS7.05版提出的解决方法是,对有线性相关的互作项,只保留一项,其他则予以说明(它是和前面哪项有线性相关)。这样可得到准确的分析结果。图2例子中的准确结果如下,这样的结果和将设计矩阵生成二次多项式后用SAS、SPSS计算的结果完全一致。
有关详细解答,见网页 http://www.chinadps.net/whatsnew.htm
|
|
4.非参数统计检验中各种大样本近似法的统计量所需样本(N)及处理组数(k)至少应该要多大?
|
Wilcoxon
符号秩检验 |
N>15 |
|
Mann–Whitney
U检验 |
N1=3
或 4 且 N2>12; N1>4 且 N2>10 |
|
Kruskal–Wallis
H检验 |
k>3
且所有的N>5 |
|
Friedman检验(方差分析) |
k=3:
N>13; k=4: N>8;k=5: N>5; k>5 |
|
符号检验 |
N>35 |
在DPS6.05以上的版本中,对上述这些非参数检验方法提供了确切概率计算和Monte
Carlo抽样概率计算的功能,以满足小样本时非参数检验的需要。
|
|
5.如何根据给出的p值来进行统计推断?
DPS在统计分析之后,多数情况下会给出假设检验中的p-值。简言之,p值就是传统所说的α水平(显著水平)。
p值可以精确地告诉我们检验结果的显著水平,而不用再重复采用不同的α水平。根据p值进行统计推断常用标准是:
如果0.01≤p<0.05,则结果显著。
如果0.001≤p<0.01,则结果极显著。
如果p<0.001,则结果是很高地显著。
如果p>0.05,则结果被认为没有统计显著性(有时记为NS)。
但是,如果0.05≤p<0.10,则有时注记为有倾向性的统计显著。
一般来说,给出p值后,如果p<0.05,则拒绝H0,即结果有统计学显著性;如果p≥0.05,则接受H0,即结果没有统计学显著性.
|
|
6. 如何看待统计学上的显著性?
统计学上的显著性和科学上的显著性是有区别的:一个研究结果统计上显著并不表明此结果在科学上是多么重要,这种情形特别容易发生在大样本时,因为大样本中一个很小的差异也可以被统计检测出来(如有500个样本,当相关系数只有0.0877,确定系数还不到1%,但统计检验结果是相关性显著)。相反,某些统计上不显著的差异结果可能在科学上是重要的,它可以促使我们进一步加大样本去发现“表面”差异。
|
|
7. 有关DPS6.xx版本?
从2005年初开始,DPS推出了6.xx版本,具体地说,其电子工作表更换升级,开发语言升级,因此是一次较大的升级过程。
|
|
8. meta分析功能为什么不放在菜单里面,而是以工作表的方式向用户提供?
meta分析只涉及一些较简单的数据加减乘除、求和,以及几处需要计算概率p值的地方。这用DPS的工作表和DPS提供的统计函数就可以实现。因此将这些功能放在工作表里面,用户用起来更直观、更方便。
|
|
9. DPS6.xx以后版本的电子表格与前面的版本有何不同?
DPS从6.0版开始采用了新的电子表格,它支持许多原来不支持的功能,如支持鼠标滑轮上下移动,公式的复制更灵活,并可拖动鼠标进行数字填充等,可极大地减少用户对有规律的数据输入的工作量。
|
|
10. 为什么有时候工作表的单元格数据显示不正常?
有时单元格里数值显示出数据不全,如下图的工作表的第二行数据显示的结果不正常。

其原因是单元格列宽不够,遇到这种情况时,将单元格列宽拉宽就可以正常显示了(如下图所示)。

|
|
11.有时输入数据,并用鼠标选中后不能分析,为什么?
多半是输入数据时是中文全角方式,这时输入的字符是黑色的。数值应该在“英文数字”状态下输入,输入在工作表里面的数字应该是蓝色。
从dps
v7.55版开始,如果输入的是中文全角字符,可以在菜单方式下执行"字符串转换为数值"功能,将其转换过来.
|
|
12. 多因素方差分析的结果看不明白怎么办(来自一统天下论坛)?
这是一个具有混杂效应的方差分析例子。当有混杂存在时,用SPSS软件进行平方和分解给不出正确的结果,如该例用SPSS分析结果中各个分量的自由度和整个自由度不等(丢失了3个自由度,用SAS计算,III型平方和分解结果也是这样)。但用版主的DPS统计软件计算出来的结果,和上面的不一样(版主认为DPS的计算结果才是正确的)。
|
|
13. 关于Duncan新复极差多重比较问题?
唐先生:
你好!
我是购买并运用DPS软件的用户。我是做玉米区域试验的,一直很相信DPS的分析数据,但最近一组数据使我对此产生了怀疑。附件中是我省区试其中一个点的数据和DPS分析结果,方差分析没什么问题,但多重比较结果却值得怀疑。用其他方法计算的Duncan新复极差测验结果不是这样。不知问题到底出在哪里?
云南省农科院粮作所 陈
陈先生,您好!
我不知道您是用什么软件进行计算的,可以肯定,您发过来的用DPS计算出来的结果是正确的。我对您发过来的数据用国外的SAS进行了验算,结果和DPS的完全相同。您可放心使用。
关于DUNCAN多重比较,国内过去的问题较多,包括我们农业高等院校的经典统计教材《......》(版主在这里略去教材名称)中引用的DUNCAN多重比较临界值表都是
错误的,在当前的DPS版本中,其DUNCAN临界值是计算出来的精确值,和国外的SAS软件的值相同。这一点在我的网站上已有介绍。
唐先生:
你好!我主要是按你提到的那本教材计算的,可能问题就出在这里。非常感谢!
|
|
|
|
14. 为什么用DPS计算得到的Duncan检验临界值和书上的不一致?
当误差自由度等于10,显著水平等于0.05时,用SAS计算得到的值和目前表格上的值也是不一致,
DPS计算结果和SAS的结果相同。经版主考查,原来是该表经H. L.
Harter修正过(Biometrics,
16,671~685),而有的统计专著上还未改过来(国外的一些专著上也有这样的问题).
| |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
| SAS计算值(DPS相同) |
3.151 |
3.293 |
3.376 |
3.430 |
3.465 |
3.489 |
3.505 |
3.516 |
3.522 |
| 查表值 |
3.15 |
3.30 |
3.37 |
3.43 |
3.46 |
3.47 |
3.47 |
3.47 |
3.47 |
|
|
15. 怎样识别Dunnett双侧检验的新表和旧表?
当误差自由度等于20,显著水平等于0.05时,新、旧表不同处理组数的Dunnett检验临界值。
| 处理组数 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
| 新表 |
2.09 |
2.38 |
2.54 |
2.65 |
2.73 |
2.80 |
2.86 |
2.90 |
2.95 |
| 旧表 |
2.09 |
2.38 |
2.57 |
2.70 |
2.81 |
2.89 |
2.96 |
3.02 |
3.07 |
|
|
16. 在Window2000下,有时做出的系统聚类图整个是黑色怎么办?
这与有的显示驱动程序有关,但是,您只要在图上用鼠标双击一下,这时会出现图形保存界面,这时,将当前图形保存为".BMP"格式的图形文件,就可以在画图程序或Word里打开并看到图形。
|
|
17. 数据太多,如有几十万个数据作聚类分析,DPS处理不了怎么办?
只要你是DPS的正版用户,你可和版主联系,版主将为你对某个模块作特殊处理,完成你特殊的需求。
|
|
18.分析时,提示数据未编辑、定义,或读数据粗出错?
将待分析数据定义成数据块?
某个单元格里不是有效的数值,如全角方式的数字,数值颜色一般是蓝色。
|
|
19.
如想从你的机器上删除dps2000版,请注意在卸载DPS过程中,当系统出现是否删除共享文件(Remove
Shared file)提示时,请选择全部不删除(No
to All)按钮,以确保您整个Windows系统安全。
|
|
20. 怎样购买DPS软件?
详情见网页 http://www.chinadps.net/register.htm,
联系电话:0571-86971892(O), 139 5816 8331
|
|
21.怎样登记注册?
当您下载,安装DPS后,进入运行的是尚未注册的DPS数据处理系统,这时得到的结果是有误差的,仅供演示用。如需正常使用,必须缴纳注册费,进行注册。
注册方法是:在DPS演示状态,用鼠标单击屏幕顶部的“帮助”下的“系统信息及注册”,这时就会出一个注册界面,请记下
|
|
22.
“二次正交旋转组合设计”和“二次通用旋转组合设计”的英文怎么翻译?
这两种实验设计方法在国内用得非常多,国内文献中的英文译法可能有几十种.有些译法老外看到的话可能根本不知道是什么东西.这段时间我在将DPS统计软件"英文化"时寻找翻译方法,得到如下表,
也许是"标准"答案吧,供大家以后发表文章时采用,译法分别为:
二次正交旋转组合设计: Orthogonal
rotatable central composite design
二次通用旋转组合设计: Uniform-precision
rotatble central composite design

|
|
23. 什么是自由度?
自由度(degree of freedom)是统计上的常用术语,其意义是随机变量能"自由"取值的个数。如有一个有4个数据(n=4)的样本,
其平均值m等于5,即受到m=5的条件限制, 在自由确定4、2、5三个数据后, 第四个数据只能是9,
否则m≠5。因而这里的自由度υ=n-1=4-1=3。推而广之,任何统计量的自由度υ=n-限制条件的个数。
|
|
24.
标准差和标准误(样本均数的标准误)的区别?
标准差和标准误都是描述变异的指标,当样本数量一定时,标准差越大,标准误也越大。但是它们所表达的含义是不同的:
标准差是描述个体观察值变异程度的大小。标准差越小,均数对一组观察值的代表性越好;
标准误是描述样本均数变异程度及抽样误差的大小。标准误越小,用样本均数推断总体的可靠性越大。
在应用中,一般来说:
标准差与均数结合,用于描述观察值的分布范围,如医学参考值范围的估计;
标准误与均数结合,用于估计总体均数可能出现的范围,如参数估计的置信区间。
|
|
25.
做两样本t检验,或多样本F检验,数据个数大于250个时怎么办?
两组数据t检验,如各组数据较多,可以将数据竖着,放成2列即可;
多组数据的F检验,当各组数据的样本量大于250个,一行放不下时,可以采用GLM模型方法进行分析,这样各组数据个数就没有限制了。(06.11.22)
|
|
26.
“二次多项式回归分析”、“均匀设计回归分析”的异同、即分别适用于哪些情形?
这两项功能菜单,执行的统计计算相同;区别是:进行“二次多项式回归分析”,要求样本个数(n)和变量个数(p)满足关系:
n>1+p(p+3)/2
如不能满足这个必要条件,则不能使用“二次多项式回归分析功能”,这时可使用“均匀设计回归分析”方法进行分析,分析时,可由用户自己选择哪些二次项和互作项进入回归方程,使之回归方程的参数个数少于实验次数(n)。
如果想由DPS自动筛选因子(或因子组合)建立回归方程,这时用户可执行“多元分析”→“回归分析”里面的“二次多项式逐步回归”、或“多因子及互作项逐步回归”、或“多因子及平方项逐步回归”分析功能。(06.11.22)
|
|
27.
非线性回归模型参数估计,要使得待估计参数值在0-1之间,在DPS系统中该如何处理(2007年1月16日)?
x1 x2
0 -9
25 -5
50 -2
100 4
150 5
200 6
300 11
400 14
600 21
800 24
1000 24
1200 26
1400 25
1600 25
2000 24
根据上述数据,拟合一个4参数的非线性方程,即令4个参数分别为 c1, c2, c3 和 c4;参数没有限制时的DPS拟合方程如下:
x2=(c1*x1+c2-sqrt((c1*x1+c2)^2-4*c1*c2*c3*x1))/2*c3-c4
但用户要求其中的c1和c3大于0,小于1; c4>0;
c2没有限制.如何根据这些条件修改拟合方程,进行参数拟合。
首先,估计参数大于0,可用取绝对值函数,如参数c4,在方程中可写为abs(c4);
对于参数c1和c3估计值要在0-1之间,可用表达式
(1/(abs(c1)+1))和(1/(abs(c3)+1))进行参数估计,估计参数值后,再根据该公式,求出该项参数估计值。例如如果求得c1=-3,那么方程该项参数估计值=1/(abs(-3)+1))=1/4=0.25。
上面这个方程式为:
x2=((1/(abs(c1)+1))*x1+c2-sqrt(((1/(abs(c1)+1))*x1+c2)^2-4*(1/(abs(c1)+1))*c2*(1/(abs(c3)+1))*x1))/2*(1/(abs(c3)+1))-abs(c4)
举一反三:如第一个参数限制在(-1,1)区间:
(1-2/(abs(c1)+1))
举一反三:如第三个参数限制在(3,5)区间: (3+2/(abs(c3)+1))
为方便建模,版主新增加了区间限制函数 limit(y)=1/(abs(x)+1),以后在公式中只要写该函数就可以了,如上述拟合方程为:
x2=(limit(c1)*x1+c2-sqrt((limit(c1)*x1+c2)^2-4*limit(c1)*c2*limit(c3)*x1))/2*limit(c3)-abs(c4)
|
|
28.
怎样解决dps8.50以前版本从Excel复制数据有时出错的问题(2007.03.30)?
有的DPS用户反映,在Win XP系统下,从Excel复制数据到DPS的电子表格,在DPS电子表格粘贴数据时,有时会出现提示为
Access violation at adress 7c93e58 in module 'ntdll.dll'. read of
adress 00000000.
的错误。经检查,这是所用电子表格组件Cell和Win
XP不太兼容的缘故(在Cell开发商提供的“超级报表”中也存在该问题)。不是DPS程序所产生的错误。 该问题,我们已和电子表格开发商取得联系。
不过最近我们发现了解决该问题的初步方法:选择数据时,在Excel表格中数据的右边多选择1~2列空的表格,这样复制数据,在DPS里面粘贴时就不会出现该错误了。
29. DPS使用时容易出错的地方
在用户界面输入参数时,不是“英文数字”方式,输入的值系统不认识,导致运行过程出错。这是必须注意的。
30.
关于多元分析中动态聚类新算法答读者问
***先生,您好:
多元分析中新动态聚类算法,是本人最近才发现的一种新的高效算法,目前尚没有相关文献可供参考。
该算法经验证、测试,确实有效,其效果也出乎了我的意料:我原来想,比SAS、SPSS里面的k-means方法好点就差不多了。结果是比SAS、SPSS等
里面的k-means方法的效果都要好得多,几乎是解决了动态聚类理论认为不能解决的全局优化问题。
出于DPS软件商业秘密的考虑,我们暂时不会公布其算法,望谅解.
致礼
唐启义, 2007年5月5日,于浙江大学
31. DPS850版在Vista上的安装
32. 待续......
|