《统计学》模拟试卷(一)一、填空题(每空1分,共10分)1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。
3、设总体X的方差为1,从总体中随机取容量为100的样本,得样本均值=5,则总体均值的置信水平为99%的置信区间_________________。(Z0.005=2.58)4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP=55亿元,则GDP年度化增长率为。
5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为,中位数为。
6、判定系数的取值范围是。
7、设总体X~,为样本均值,S为样本标准差。当未知,且为小样本时,则服从自由度为n-1的___________________分布。
()①、如何科学地由样本去推断总体②、如何科学地从总体中抽出样本③、怎样控制样本对总体的随机性误差2、数据质量的评价标准包含的方面有:
()①、精度②、及时性③、关联性3、以下数据的收集方法属于询问调查的是:
()①、拉氏指数②、物质生活质量指数③、帕氏指数四、判断题:(判断命题的正误。对的,在题干前的括号内打√号;
错的,在题干前的括号内打×号。共10题,每题1分。)()1、茎叶图主要用于顺序型数据的显示。
()2、四分位数不受数据极端值的影响。
()3、在设计调查问卷的回答项目时,封闭性问题的答案往往是选择回答型,所以设计出的答案一定要穷尽和互斥。
()4、标准分数只是将原始数据进行线性变换,没有改变该组数据分布的形状,也没有改变一个数据在该组数据中的位置,只是使该组数据的平均数为0,标准差为1。
()5、假设检验中要使α和β同时减少的唯一方法是减少样本容量。
()6、对一个正态总体进行抽样调查,不论样本容量大小如何,样本均值统计量总是服从正态分布的。
()7、在参数估计中,样本比例p是非随机变量,而总体参数π通常是未知的随机变量。
()8、对两个总体方差相等性进行检验,在=0.01的显著性水平上拒绝了原假设,这表示原假设为真的概率小于0.01。
()10、抽样调查中,样本容量的大小取决于很多因素,在其他条件不变时,样本容量与边际误差成正比。
五、简要回答下列问题(共2题,每题6分。)1、统计学的确对我们的生活的各个方面起着重要的作用,但如果有意或者无意地误用统计学方法,其结论则会带来更大的欺骗性。为了避免这种情况的发生,请根据你的了解,写出1个误用统计学方法的例子,并说明应该如何正确应用方法?六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;
(φ(2)=0.9545)3、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:
产品产量(台)xi4050507080生产费用(万元)yi130140145150156要求:①、利用最小二乘法求出估计的回归方程;
②、计算判定系数R2。
附:
4、某家具公司生产三种产品的有关数据如下:
产品名称总生产费用/万元报告期产量比基期增长(%)基期报告期写字台45.453.614.0椅子30.033.813.5书柜55.258.58.6计算下列指数:①拉氏加权产量指数;
②帕氏单位成本总指数。
模拟试卷(二)一、填空题(每小题1分,共10题)1、我国人口普查的调查对象是,调查单位是。
2、___=频数÷组距,它能准确反映频数分布的实际状况。
3、分类数据、顺序数据和数值型数据都可以用图来显示。
4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数是。
5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP年度化增长率为。
6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了。
7、对回归系数的显著性检验,通常采用的是检验。
8、设置信水平=1-α,检验的P值拒绝原假设应该满足的条件是。
错的,在题干前的括号内打×号。共10题,每题1分。)()1、统计要说明现象总体的数量特征,必须要先搜集该总体中的全部个体的数据。
()2、询问调查属于定性方法,它通常围绕一个特定的主题取得有关定性资料。
()3、箱线图主要展示分组的数值型数据的分布。
()4、异众比率主要用于衡量中位数对一组数据的代表程度。
()5、统计数据的误差通常有抽样误差和非抽样误差两类。
()6、若一组数据的均值是450,则所有的观测值都在450周围。
()7、移动平均不仅能消除季节变动,还能消除不规则变动。
()8、右侧检验中,如果P值<α,则拒绝H0。
()10、方差分析是为了推断多个总体的方差是否相等而进行的假设检验。
五、简要回答下列问题(共2题,每题6分。)1、结合你的专业学习,写出2个应用统计学知识解决实际问题的例子。
2、根据下面的方差分析表回答有关的问题:方差分析差异源SSdfMSFP-valueFcrit组间0.00105320.00052732.916671.34E-053.88529组内0.000192120.000016总计0.00124514注:试验因素A有三个水平。
⑴写出原假设及备择假设;
⑵写出SST,SSA,SSE,,MSA,MSE,n以及P值;
⑶判断因素A是否显著。
六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)1、某小区居民共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95.45%(Zα/2=2)(2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?(设边际误差E=0.08)2、下面是某商店过去9周的营业额数据:
周序号123456789营业额473470481449544601587644660(1)采用指数平滑法(平滑系数α=0.5)预测第十周的营业额(F8=555.19);
出口价出口量基期p0报告期p1基期q0报告期q1甲1001508082乙801408001000丙1201206065(1)计算拉氏出口量指数;
六、计算题1题解:
是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。
已知:则有:平均误差=极限误差据公式代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4)2题解:
(3)平滑系数α=0.5时误差均方=9876.51<平滑系数α=0.3时误差均方=11515.01用平滑系数α=0.5预测更合适。
3题解①计算估计的回归方程:
==0.567144.2–0.567×58=111.314估计的回归方程为:=111.314+0.567②计算判定系数:
4题解:
①拉氏加权产量指数=②帕氏单位成本总指数=参考答案:统计学(2)一、填空题1、具有我国国籍并在我国境内长住的人(指自然人)、每一个人2、频数密度6、7.1%3、饼图、条形7、t4、286.58、P<α5、44%9、16二、单项选择题1234567②②①③②③③891011121314①①③②③②②三、多项选择题1234567①②①②③①③①③①②③②③①②③四、判断题12345678910××××√×√√××五、简要回答下列问题1、举例略。
2、⑴原假设备择假设不全等⑵SST=0.001245SSA=0.001053SSE=0.000192MSA=0.000527MSE=0.000016P值=1.34E-05⑶F值=32.91667>拒绝原假设,因素A显著。
(1)n=50p=32/50=64%E=应抽取100户进行调查。
2题解:
(2)平滑系数α=0.5时误差均方=3847.31<平滑系数α=0.3时误差均方=5112.92用平滑系数α=0.5预测更合适。
(3)(4)估计的回归方程:
(5)检验线性关系的显著性:
H0:
∵SignificanceF=2.17E-09<α=0.05∴拒绝H0,,线性关系显著。
A100所中学B20个城市C全国的高中生D100所中学的高中生2.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2005年城镇家庭的人均收入数据。这一数据属于()。
A标准差大的离散程度也就大B标准差大的离散程度就小C离散系数大的离散程度也就大D离散系数大的离散程度就小5.在下列指数中,属于质量指数的是()。
A产量指数B单位产品成本指数C生产工时指数D销售量指数6.定基增长速度与环比增长速度的关系为()。
A定基增长速度等于相应的各个环比增长速度的算术和B定基增长速度等于相应的各个环比增长速度的连乘积C定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1D定基增长速度等于相应的各个环比增长速度的连乘积加1(或100%)7.某企业报告期产量比基期增长了10%,生产费用增长了8%,则其产品单位成本降低了()。
A1.8%B2.5%C20%D18%8.用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低50%,在其他条件不变的情况下,则样本容量需要扩大到原来的()。
A回归方程B回归模型C估计的回归方程D理论回归方程12.平均指标是用来反映一组数据分布的()的指标。
ABCD14.在其他条件不变的情况下,降低估计的置信水平,其估计的置信区间将()。
A变宽B变窄C保持不变D无法确定15.在同等条件下,重复抽样误差和不重复抽样误差相比()。
A工号和工作效率B受教育程度与收入水平C子女身高和父母身高D收入水平与消费量E人口与物价水平5.下列属于时期数列的有()。
A某商店各月库存数B某商店各月的销售额C某企业历年产品产量D某企业某年内各季度产值E某企业某年各月末人数四、简答题1.举例说明总体、样本、参数、统计量这几个概念及他们之间的区别和联系(8分)2.简述众数、中位数和均值的特点和应用场合。(7分)五、计算分析题1.从一个正态总体中随机抽取样本容量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值95%的置信区间。(已知)。(12分)2.已知某企业连续5年钢产量资料如下:
年份19971998199920002001钢产量(千吨)200240360540756发展速度(%)环比定基增长速度(%)环比定基试根据上表资料填出表中数字。(注意没有的数字划“—”,不准有空格)(10分)3.某商场出售三种商品销售资料如下表所示:(14分)商品名称计量单位销售量价格(元)销售额(元)基期q0报告期q1基期p0报告期p1p0q0p1q1p0q1甲乙丙台件吨100250400120300600801840822050合计————试计算:(1)三种商品销售额总指数;
(2)三种商品的价格综合指数;
(3)三种商品的销售量综合指数;
(2)用个人收入作自变量,消费支出作因变量,求出估计的直线回归方程,并解释回归系数的实际意义。
(3)当个人收入为100万元时预测该地区的消费支出为多少?(注:计算结果保留4位小数)答案:
统计学试卷(三)标准答案一、判断题(在题后的括号里正确划“√”、错误划“×”,每题1分,共计10分)1.√2.√3.√4.×5.×6.√7.√8.√9.√10.√二、单项选择题(从下列每小题的四个选项中,选出一个正确的,并填写在题后的括号内,每题1分,共计15分)1.D2.C3.B4.C5.B6.C7.A8.C9.B10.B11.B12.C13.C14.B15.B三、多项选择题(选出两个及两个以上的正确答案,并填写在题后的括号内,每题2分,共计10分)1.CDE2.ABCDE3.AC4.BCD5.BCD四、简答题(共计15分)1.举例说明总体、样本、参数、统计量这几个概念及他们之间的区别和联系(8分)答:区别:总体是具有某种共同性质的多个个体组成的集合;
样本是从总体中抽取的一部分个体构成的集合;
参数是用来描述总体特征的概括性数字的度量;
统计量是用来描述样本特征的概括性数字度量。
联系:样本是从总体中抽取的一部分个体组成的集合;
参数是用来描述总体的特征的;
统计量是用来描述样本的特征的。
例如:河南省的所有工业企业构成一个总体,从中抽取100个企业就构成一个样本,对这100个企业构成的样本计算的企业平均工资、企业平均产值等就是统计量,而河南省所有工业企业的平均工资、平均产值则是参数。
2.简述众数、中位数和均值的特点和应有场合?(7分)答:众数是一组数据中出现次数最多的变量值,是一种位置代表值,不受极端值的影响,具有不唯一性,也可能没有众数,主要用于分类数据集中趋势的测度;
中位数是一组数据排序后处在中点位置的变量值,也是位置代表值,不受极端值的影响,主要用于排序型数据集中趋势的测度,均值是根据数值型数据计算的,利用全部的数据信息,具有优良的数学性质,是实际中最广泛的集中趋势的测度值。
五、计算分析题(本题共50分)1.解:已知n=8,总体服从正态分布,未知,样本抽样分布服从t分布置信下限=10-2.89=7.11置信上限=10+2.89=12.89总体均值的95%的置信区间为[7.11,12.89]2.已知某企业连续五年钢产量资料如下:
年份19971998199920002001钢产量(千吨)200240360540756发展速度(%)环比(—)(120)(150)(150)(140)定基(100)(120)(180)(270)(378)增长速度(%)环比(—)(20)(50)(50)(40)定基(0)(20)(80)(170)(278)3.某企业三种产品的销售资料如下表所示:
商品名称计量单位销售量价格(元)销售额(元)2000年q02002年q12000年p02002年p1p0q0p1q1p0q1甲乙丙台件吨100250400120300600801840822050(8000)(4500)(16000)(9840)(6000)(30000)(9600)(5400)(24000)合计—————(28500)(45840)(39000)解:(1)三种产品销售额增长情况:
相对数:商品销售额指数绝对数:
(2)价格综合指数(3)相销售量综合指数(4)综合分析160.84%=136.84%*117.54%17340(元)=10500(元)+3840(元)从相对数上看:三种商品销售额报告期比基期提高了60.84%,是由于销售价格的提高是销售额提高了17.54%和由于销售量的增加使销售额提高了36.84%两因素共同影响的结果。从绝对值上看,报告期比基期多销售17340元,由于销售价格的提高而使销售额增加6840元和由于销售量的提高是销售额增加10500元两因素共同影响的结果。
4.某地区1991-1995年个人消费支出和收入资料如下:
(2)设估计的值直线回归方程为∴回归系数1.1688说明当个人收入增加1个万元时,消费支出平均增加1.1688万元。
(3)当万时,
1、参数是指:
A、参与个体数B、研究个体数C、总体的统计指标D、样本的总和E、样本的统计指标
2、统计工作的步骤正确的是
A收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断
3.概率P=0,则表示
A某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对
4、统计上所说的样本是指:
A、按照研究者要求抽取总体中有意义的部分B、随意抽取总体中任意部分
C、有意识的抽取总体中有典型部分D、按照随机原则抽取总体中有代表性部分
E、总体中的每一个个体
5、某地区抽样调查1000名成年人的血压值,此资料属于:
A、集中型资料B、数值变量资料C、无序分类资料
D、有序分类资料E、离散型资料
6、编制频数表的步骤如下,除了:
A、找全距B、定组距C、分组段D、划记E、制分布图
7.正态曲线下.横轴上,从均数到+∞的面积为。
A.97.5%B.95%C.50%D.5%E.不能确定
8.做频数表时,以组距为5,下列哪项组段划分正确
A.0一,5一,10一,…B.0—5,5一10,10一,…
C.一5,一10,一15,…D.0—4,5—9,10一,…E.5一,7一,9一,…
9、标准差越大的意义,下列认识中错误的是:
A、观察个体之间变异越大B、观察个体之间变异越小
C、样本的抽样误差可能越大D、样本对总体的代表性可能越差E、以上均不对
10、某厂发生食物中毒,9名患者潜伏期分别为:
16、
2、
6、
3、30、
2、lO、
2、24(小时),问该食物中毒的平均潜伏期为多少小时:
A、5B、5.5C、6D、lOE、12
11.各观察值均加(或减)同一数后:
A均数不变,标准差改变B均数改变,标准差不变C两者均不变D两者均改变
E以上均不对
12.正态分布是以
At值为中心的频数分布B参数为中心的频数分布C变量为中心的频数分布
D观察例数为中心的频数分布E均数为中心的频数分布
13.均数与标准差之间的关系是
A标准差越大,均数代表性越大B标准差越小,均数代表性越小
C均数越大,标准差越小D均数越大,标准差越大E标准差越小,均数代表性越大
14.比较两种药物疗效时,对于下列哪项可作单侧检验()。
A.已知A药与B药均有效B.不知A药好还是B药好
C.已知A药不会优于B药D.不知A药与B药是否均有效E.已知A药与B药均无效
15、统计推断的内容:
A.是用样本指标估计相应的总体指标B.是检验统计上的“假设”
C.a、b均不是D.a、b均是E、以上都错
16、用一种新药治疗高血脂症8例,观察治疗前后红血清成固醇的浓度变化,欲知该药是否有效,宜采用:A、配对设计t检验B、成组设计两样本均数比较的t检验
C、成组设计两样本几何均数比较t检验D、两样本均数比较u检验E、x2检验
17、由10对(20个)数据组成的资料作配对t检验,其自由度等于:
A、10B、20C、9D、18
18.下列哪项不是t检验的注意事项
A资料应具备可比性B下结论切忌绝对化C根据资料选择适宜的检验方法
D分母不宜过小E资料应服从正态分布
19.标准差与标准误的关系是:
A两者相等B后者大于前者C前者大于后者D不一定E随样本例数不同
20.在同一正态总体中随机抽取含量为n的样本,理论上有95%的总体均数在何者范围内A均数加减1.96倍的标准差B均数加减2.58倍的标准差
C均数加减1.96倍的标准误D均数加减2.58倍的标准误E以上都不对
21.两样本作均数差别的t检验,要求资料分布近似正态,还要求
A两样本均数相近,方差相等B两样本均数相近
C两样本方差相等D两样本总体方差相等E两样本例数相等
22、下面()是错误的:
A.标准误大,说明用样本均数代表总体均数可靠性大
B.标准误小,说明用样本均数代表总体均数可靠性大C.标准差大,标准误也大
D.样本含量大,标准误则小E.标准误常用来估计总计均数可信区间
23、要评价某市一名8岁男孩的身高是否偏高或偏矮,应选用的统计方法是:
A.用该市8岁男孩身高的95%或99%正常值范围来评价B.作身高差别的假设检验来评价
C.用身高均数的95%或99%可信区间来评D.不能作评价E以上都不对
24、造成均数抽样误差的原因是
A.个体差异B.群体差异C.样本均数不同D.总体均数不同E以上都不对
25、同一自由度下,P值增大
At值不变Bt值增大Ct值减小Dt值与P值相等Et值增大或减小
26.男性人口数/女性人口数,这一指标为:A、率B、构成比C、相对比
D、动态数列E、不是相对数
27、构成比有个重要特点是()。
A、百分比总和必等于100%B、百分比总和必小于100%
C、百分比总和必大于100%D、以上均不对E、以上都错
28.随机选取男200人,女100人为某寄生虫病研究的调查对象,
测得其感染阳性率分别为20%和15%,则合并阳性率为__________
A.35%B.16.7%C.18.3%D.无法计算E、30%
29.四格表资料的卡方检验时无需校正,应满足的条件是()。
A.总例数大于40B.理论数大于5C.实际数均大于l
D.总例数大于40且理论数均大于或等于5E.总例数小于40
30、某研究者对50份痰液标本,每份分别接种在甲乙培养基上,
观察结核杆菌的生长情况并想比较两种培养基的培养效果是否一致,资料见下表。
问应该选择的统计方法是:
A.确切概率法B.四格表资料的卡方检验C.配对计数资料的卡方检验
D.行乘列表资料的检验E.配对计量资料的t检验
甲培养基乙培养基合计
﹢231235
﹣7815
合计302050
31.作四格表卡方检验,当N>40,且__________时,应该使用校正公式
AT5CT5E1532.相对数使用时要注意以下几点,其中哪一项是不正确的A比较时应做假设检验
B注意离散程度的影响
C不要把构成比当率分析D二者之间的可比性E分母不宜过小
33、X2四格表中四个格子基本数字是:
A.两个样本率的分子与分母B.两个构成比的分子与分母
C.两对实测阳性绝对数和阴性绝对数D.两对实测数和理论数E.以上都不对
34.为表示某地近20年来婴儿死亡率的变化情况,宜绘制()。
A.普通线图B.直方图C.直条图D.散点图E.统计地图
35.某医院收集了近期门诊病人的病种构成情况资料,宜绘制:
A.直条图B.圆图C.线图D.直方图E.半对数线图
36.图示某地某年流行性乙型脑炎患者的年龄分布,宜绘制:
A.条图B.百分条图C.圆图D.直方图E.线图
37.比较1995年某地三种传染病白喉、乙脑、痢疾的病死率,选择的统计图是
A.直方图B.半对数图C.条图D.线图E.百分图
38.关于统计资料的列表原则,错误的是
A.横标目是研究对象,列在表的左侧;纵题目是分析指标,列在表的右侧
B.线条主要有顶线,底线及纵标目下面的横线,分析指标后有斜线和竖线
C.数字右对齐,同一指标小数位数一致,表内不宜有空格
D.备注用“*”标出,写在表的下面
E.标题在表的上端,简要说明表的内容
39、对某市七个区的SO2年平均浓度作比较,应绘制()图:A.构成图
B.直条图C.直方图D.线图E.曲线图
40、变异系数是表示资料的:
A.变异数B.对称分布C.集中趋势D.相对变异E.平均水平
41、反映某一事件发生强度的指标应选用:
A、构成比B、相对比C、绝对数D、率E、变异系数
42.在进行成组设计资料的t检验前,要注意两个前提条件,
一要考查各样本是否来自正态总体,二要()
(A)核对数据(B)作方差齐性检验(C)求、s、(D)作变量代换
43.当样本量增大时,以下说法正确的是()。
A.标准差会变小B.均数标准误会变大C.均数标准误会变小
D.标准差会变大E.均数标准误不变
44.随机区组、完全随机设计设计的自由度、SS各可分解为几部分()。
A.3,2B.4,2C.3,3
D.2.2E.4,3
45.计量资料、计数资料和等级资料的关系:是:
A.计量资料兼有计数资料和等级资料的一些性质
B.计数资料兼有计量资料和等级资料的一些性质
C.等级资料兼有计量资料和计数资料的一些性质
D.计数资料有计量资料的一些性质
E.以上都不是46.2.58SX表示:
A.95%的正常值范围B.95%的可信区间C.99%的正常值范围
D.99%的可信区间E.以上都不对
47.进行统计分析的资料必须是()
A、完整、准确、及时的B、随机取得的C、满足条件齐同的D、数量足够的E、以上都对
48.指出下列变量中哪一个指标为统计量
A.
pB.C.μD.πE.β
249.R×C表的检验的自由度为:
A.R1B.C
50.已知r
A.b1C.RC1D.(R1)(C1)E.RC21,则一定有:1B.a1C.SY,X0D.SY,XSYE.SY,XSX
51.配对比较的秩和检验的基本思想是:如果假设检验成立,则对样本来说:
A.正秩和的绝对值大于负秩和的绝对值
B.正秩和的绝对值小于负秩和的绝对值
C.正秩和的绝对值与负秩和的绝对值不会相差很大
D.正秩和的绝对值与负秩和的绝对值相等
E.正秩和的绝对值与负秩和的绝对值相差很大
52.当第二类错误β由0.2变到0.3时,则第一类错误α是:
A.增大B.减小C.不确定D.不变化E.以上都不对
53.抽样误差指的是()
A、个体值与总体值之差B、样本统计量之间及样本统计量与总体参数值之差
C、个体值与统计量值之差D、总体参数值与总体参数值之差E、以上都不对