论文导读:以《中文科技期刊数据库(全文版)》(重庆维普)为统计源,以1990-2007年间的苹果种质资源研究与利用文献为统计对象,采用关键词检索方式,分类方式和标准见表1。以年度和文献量为随机变量,建立回归数学模型,进行回归分析,并进行趋势预测。并运用工具EXCEL,进行假设检验、方差分析、相关分析和回归分析。经统计,1990-2007年间与苹果种质资源研究与利用相关的文献共931篇,图2是发表文献数量按年度的统计情况。
关键词:苹果,种质资源,文献,回归分析,趋势分析
1. 研究背景和目的
我国是世界苹果的起源中心之一,苹果产业是重要的农业产业,但存在的现实问题是苹果品种的单一化和种质流失现象日趋严重,大面积栽培的品种数目越来越少[4],这不仅直接影响了苹果的品种和质量,还为苹果产业的良性可持续发展埋下了隐患。因此种质资源研究受到世界许多国家的重视。我国苹果种质资源研究的情况如何,未来研究趋势如何?本文通过对相关文献的数理统计分析,采用了线性回归分析法对农业科技文献进行系统研究,来揭示这一特定科研活动的内在联系与特征,从而为更好地开展科研活动提供理论依据。
2. 研究方法
2.1 数据来源和统计标准
以《中文科技期刊数据库(全文版)》(重庆维普)为统计源,以1990-2007年间的苹果种质资源研究与利用文献为统计对象,采用关键词检索方式,分类方式和标准见表1。
表1文献统计分类方式和标准
2.2.1 比较分析法
在对统计源数据统计的基础上,建立发表时间、作者属地、研究方向与数量之间的关系,并通过纵向(历史)和横向(属地、研究内容)的比较分析,揭示其差异。
2.2.2 数理统计法——回归分析
以年度和文献量为随机变量,建立回归数学模型,进行回归分析,并进行趋势预测。并运用工具EXCEL,进行假设检验、方差分析、相关分析和回归分析。
3. 统计与分析
3.1 苹果种质资源研究文献量的统计
经统计,1990-2007年间与苹果种质资源研究与利用相关的文献共931篇,图2是发表文献数量按年度的统计情况。
从图2分析得出,1990年-2007年期间,苹果种质资源研究的文献发表量总体呈增长趋势,2007年较1990年增加了48篇,增长了2.8倍。其中2000年较1990年增加了9篇,增幅33.3%;2007年较1999年增加了42篇,增幅127.3%,2000年后增幅明显加大,发表量明显增多。表明进入21世纪后,我国加强了对苹果种质资源的研究和应用,科技工作者在该领域的研究成果较为丰富,科技活动的文献产出明显增多,科技政策、经济形势朝着有利于科研活动的方向发展。

图2文献发表年度—数量统计
3.2 建立散点图
根据图2建立散点图3。

图3年度—文献量散点图
3.3 建立一元线性回归模型
由于年度与文献量之间为非确定性的函数关系,即它们不仅与时间之间存在关系,还会有其它因素影响着文献数量,因此文献量为一随时机变量。我们假设它们之间存在着一元线性数关系,并满足一元回归方程^y =a+bx,其中 ^y 为公式算出的理论预测值,a为归截距,b为回归系数。则相关系数R值为:

R表示时机变量x、y的线性关系密切程度,是检验模型精度的标准,当︱R︱=1时,x、y完全线性相关;当︱R︱=0时,x、y不线性相关;当0<R<1时,x、y正相关;当-1<R<0时,x、y负相关;且当︱R︱值愈大,x、y线性关系吻合度高;相反则认为x、y之间不存在线性相关关系。
3.4 建立与检验一元线性回归方程
根据建立的数学模型,计算得R=0.8647,其一元线性回归方程为:y=3.2848x–6513,表明随着年度每向前推进一年,文献的增加量为3.2848。论文参考网。
回归方程的相关分析与检验:
(1)相关性分析
样本个数:n=18,自由度为16。
当置信度为95%时,即当α=0.05时,查表得R0.05=0.4683,而回归方程R=0.8647,极显著,因而回归方程是真实存在的,表明年份和文献发表量之间存在着高度的线性相关关系。论文参考网。
(2)t检验
由表2可知,偏回归系数b 的t值为6.886436,取α=0.05,查t分布临界值表,得临界值为2.12<6.886436,说明年度变量作用显著。概率值P=3.66×10-6<0.01,表明年度与苹果种质资源研究文献总量之间的回归关系达到极显著水平。
表2 回归系数表
|
标准误差 |
t Stat |
P-value |
下限 95.0% |
上限 95.0% |
Intercept |
953.2877 |
-6.83216 |
4.03E-06 |
-8533.89 |
-4492.13 |
X ariable |
0.477 |
6.886436 |
3.66E-06 |
2.273635 |
4.296024 |
(3)F检验
由表3可知,F服从自由度为(1,16)的F分布。取α=0.05,查F分布临界值表,得临界值为4.49<47.423,回归方程显著。
1/2 1 2 下一页 尾页 |