零五文档网 - www.lwzxt.com 2024年05月20日 12:43 星期一
  • 热门搜索:
  • 当前位置 首页 > 专题范文 > 调查报告 >

    相关与回归分析的实验报告(8篇)

    来源:网友投稿 发布时间:2023-05-04 10:35:07

    篇一:相关与回归分析的实验报告

      

      应用回归分析实验报告1应用回归分析实验报告

      日期:2014年

      月

      日

      班级13应用统计

      姓名

      刘金兴

      学号2013154020实验

      利用spss软件对销售收入y和广告费用x进行回归分析

      名称

      问题背景描述:为了调查某广告对销售收入的影响,某商店记录了5个月的销售收入y(万元)和广告费用x(万元),数据见表2.6:表2.6:月份12345x12345y1010202040实验目的:学会初步使用spss软件和利用spss软件进行简单的回归分析。

      实验原理与数学模型:由散点图我们看到,随着广告费用x(万元)的增加,销售收入y(万元)也随之增加,而且5个样本点大致分布在一条直线的周围。因此,用直线回归模型去描述它们是合适的。故可以采用一元线性回归模型。

      实验所用软件及版本:IBMSPSS19.0主要内容(要点):(1)画散点图。

      (2)X与y之间是否大致呈线性关系,(3)用最小二乘估计求出回归方程。

      ,(4)求回归标准误差。

      ??(5)给出与的置信度为,,,的区间估计。,,01(6)计算,与,的决定系数。

      (7)对回归方程作方差分析。

      ,(8)作回归系数1的显著性检验。

      (9)作相关系数的显著性检验。

      (10)对回归方程作残差图并作相应的分析。

      (11)求当广告费用为,.,万元时,销售收入将达到多少,并给出置信度为%95的置信区间。

      实验过程记录(含基本步骤、主要程序清单及异常情况记录等):(1)散点图如图所示:

      (2)由散点图可得,x与y之间大致呈线性关系。(3)利用spss软件对数据进行分析得下表:a系数

      非标准化系数

      标准系数

      模型B标准

      误差

      试用版tSig.1(常量)-1.0006.351-.157.885x7.0001.915.9043.656.035a.因变量:yy,,1,7x由表可得,用最小二乘估计求出的回归方程为:?(4)求回归标准误差:模型汇总

      标准

      估计的误模型RR方

      调整R方

      差

      a1.904.817.7566.05530a.预测变量:(常量),x。

      2,由以上可以知道回归标准误差=6.00530,=6.00530*6.00530=36.0636。

      ?,?

      ,?(5)与

      得置信度为%95的区间估计:,,01a系数

      B的95.0%置信区

      非标准化系数

      标准系数

      间

      模型B标准

      误差

      试用版tSig.下限

      上限1(常量)-1.0006.351-.157.885-21.21119.211x7.0001.915.9043.656.035.90613.094a.因变量:y,?由以上可以知道:给出

      与

      的置信度为%95的区间估计分别为,,01(0.906,13.094)(-21.211,19.211)。

      (6)利用spss软件可得下表:模型汇总

      更改统计量

      模型R方更改F更改df1df2Sig.F更改

      a1.81713.36413.035a.预测变量:(常量),x。

      2r由上表可知,x与y的决定系数为=0.817。

      (7)由spss软件对回归方程做方差分析得:

      bAnova模型

      平方和df均方FSig.a1回归490.0001490.00013.364.035残差110.000336.667总计600.0004a.预测变量:(常量),x。

      b.因变量:y由方差分析表可知,F=13.364,sig=0.035,说明y对x的线性关系显著。

      (8)做回归系数

      的显著性检验:,1a系数

      B的95.0%置信区

      非标准化系数

      标准系数

      间

      标准

      误

      模型B差

      试用版tSig.下限

      上限

      1(常量)-1.0006.351-.157.885-21.21119.211x7.0001.915.9043.656.035.90613.094a.因变量:y由上可知,t=3.656,又得出=2.353,t=3.656>tt,,22所以,接受原假设认为显著不为0,因变量y对自变量x的一元线性回归H:0,,,,011成立。

      (9)对相关系数做显著性检验得:相关性

      yxPearson相关性y1.000.904x.9041.000Sig.:单侧:y..018x.018.Ny55x55,,1%,,5%由上表可得,r=0.904,小于表中的相应值同时大于表中的相应值,x与y有显著的线r?

      性关系.(10)残差图如下图所示:

      从图上看,残差是围绕e=0随机波动,从而模型的基本假设是满足的。

      y,,2??(11)当广告费=4.2万元时,销售收入万元,置信度为%95的置信区间近似为,xy,28.400即(17.1,39.7)。

      思考与深入:1.通过实验,我学会了画散点图,分析因变量与自变量之间的线性关系。2.利用一元线性回归模型来预测数据,是我们生活中常用到的工具,所以要多操作,学好SPSS,这样有助于提高我们

      的工作效率。

      教师评语:

    篇二:相关与回归分析的实验报告

      

      回归分析实验报告实验报告实验课程:[信息分析]专业:[信息管理与信息系统]班级:[]学?姓名:[]指导教师:[请输?姓名]完成时间:2013年6?28??.实验?的多元线性回归简单地说是涉及多个?变量的回归分析,主要功能是处理两个变量之间的线性关系,建?线性数学模型并进?评价预测。本实验要求掌握附带残差分析的多元线性回归理论与?法。?.实验环境实验室308教室三.实验步骤与内容1打开应?统计学实验指导书,新建excel表2.打开SPSS,将数据输?。3.调?SPSS主菜单的分析——>回归——>线性命令,打开线性回归对话框,指定因变量(?业GDP?重)和?变量(?业劳动者?重、固定资产?重、定额资?流动?重),以及回归?式;逐步回归(图1)

      图1线性对话框4.在统计栏中,选择估计以输出回归系数B的估计值、t统计量等,选择Duribin-watson以进?DW检验;选择模型拟合度输出拟合优度统计量值,如R^2、F统计量值等(图2)。图2统计量栏5.在线性回归栏中选择直?图和正态概率图以绘制标准化残差的直?图和残差分析与正态概率?较图,以标准化预测值为纵坐标,标准化残差值为横坐标,绘制残差与Y的预测值的散点图,检验误差变量的?差是否为常数(图3)。

      图3绘制栏6.提交分析,并在输出窗?中查看结果,以及对结果进?分析。系统在进?逐步分析的过程中产?了两个回归模型,模型1先将与因变量(销售收?)线性关系的?变量地区??引?模型,建?他们之间的?元线性关系。?后逐步引?其他变量,表1中模型2表明将?变量?均收?引?,建??元线性回归模型,可见地区??和?均收?对销售收?的影响同等重要。从表2中给出了两个模型各?的R^2和调整后的R^2,第?个模型中的销售收?中有99%的变动可以?地区??的变动解释,第?个模型中地区??和?均收?的变动可以解释销售收?中99.9%的变动,显然第?个模型的拟合数据效果?较好?点。此外,还给出了第?个模型的DW简?之2.701,按照a=0.05、n=15、k=2,查表,得到DW检验临界值dl和du分别为0.95和1.54,因为du<=d<=4—du,不从在?相关。

      表3中给出了两个模型的F检验值,查表可知当a=0.05,?由度为(1,13)时,F检验的临界值为4.67,第?个模型的F值为1432.139,远远?于临界值,拒绝原假设,备择假设为真,即?少有?个bi不等于0,因此模型1有效。当a=0.05,?由度为(2,12)时,F检验的临界值为3.88,第?个模型的F值为5679.466,模型2也通过了有效性的检验。根据表中?标准化系数B的数值可知,逐步回归过程先后建?的两个回归模型分别是:模型1:销售收?=0.228+0.53*地区??模型2:销售收?=0.35+0.05*地区??+0.092*?均收?表中给出了两个模型各个?变量系数的t检验值,其?由度为n-k-1,查表可知当a=0.05,?由度为13时,t检验的临界值为2.160,?由度为12时,t检验的临界值为2.179,可见回归系数显著。此外,F统计量的值较?,t统计量的值也通过了检验,因此不存在严重的多元共线性问题。回归分析中,总假定残差服从正态分布,图4和图5就是根据样本数据的计算结果显?残差分布的实际状况,然后对残差分布是否为正态分布的假设做出检验。

      图4残差分布直?图图5观测量累计概率图从残差的直?图与图上的正态分布曲线相?较,可以认为残差基本服从正态分布。进?步观察观测量累计概率图(图5),图中的斜率对应着?个均值为0的正态分布,可以看出图上的散点?致散布在斜线的附近,因此可以认为残差分布基本上是正态的。

      图6标准残差与标准y的预测值散点图从图6中看到,随着y的变化,残差?明显变化,因此误差变量的?差为常数,不具有异?差性。7.进?预测正如前?所说的,多元当中计算特定的y值预测区间的置信区间估计以及给定x的条件下y期望值的置信区间估计所使?的公式?较复杂们可以使?SPSS进?简化,操作步骤为:1)在原始数据?件中进?回归模型的?变量下?输?给定的值,相应的因变量将产?缺失值;2)选择主菜单分析——>回归——>线性,指定?变量和因变量;3)单击保存对话框,选择预测值未标准化。选择预测区间均值、单值以及置信区间95%,4)提交运?,除了输出回归分析结果外,还将在数据?件中?成pre_1、lmci_1、umic_1、、lici_1和uici_1等变量。Pre_1保存点预测值,lmci_1和umci_1分别保存y期望值预测期间的下限和上限,lici_1和uici_1分别保存特定y值预测区间的下限和上限。图图8在图7和图8中,我们可以得到:时间t=1,销售收?的预测值是1.61896,地区??的预测值是1.60060,?均收?的预测值1.63731,?销售收?(置信度为95%)为1.56809~1.66982.将数据导出excel中,求均值得:在整段时间?,销售收?的预测值是1.506,地区??的预测值是1.485191,?均收?的预测值1.526811,?销售收?(置信度为95%)为1.45406~1.55794.

    篇三:相关与回归分析的实验报告

      

      统计学实验报告

      学

      号:

      姓

      名:

      专

      业:

      班

      级:

      指导教师:

      工商管理

      101吴风庆

      实验(三)

      实验题目

      实验地点

      实验目的:

      商学实验中心207相关与回归分析

      实验日期

      2012-5-91.掌握相关分析

      2.掌握回归模型的建立

      3.掌握时间序列中移动平均、指数平滑与趋势测定的方法

      实验环境

      WindowsXP系统

      Excel统计软件

      实验步骤及结果分析:(一)

      1.

      加载宏

      2.回归分析输入数据

      3.回归分析数据结果

      4.1.MultipleR为相关系数;RSquare为判定系数R2=1-SSE/SST=SSR/SST,也称拟合优度,反映整体的拟合情况;计算得R2=0.632151说明在出租率Y的变动中,能被每平方米租金多少的回归方程解释的比例为0.632151.。AdjustedRSquare为调整后的判定系数R2。

      其意义与R2类似.

      2.上表中的方差分析是指在回归分析中利用方差分析的思想进行显著性检验,其原假设是H0:?i?y)?2;残差SS是指残差平方线性关系不显著。回归分析SS是指回归平方和SSR??(yi?1n?)2和

      SSE=?(yi?yi?1n回归分析MS=SSR/k;残差MS=SSE/(n-k-1),其中kn-k-1分别为SSRSSE的自由度(df)

      3.检验统计量F=(SSR/k)/(SSE/(n-k-1))~F(k,n-k-1).4.上表中的Coefficients列指系数,其中Intercept为截距,XVariable1为自变量;标准误差指回归系数的标准误差,其中:S?=

      S?

      1/n?(x)/?(xi?x)2i?1n2;

      S?1?S?/?(xi?11ni?x)2;

      tSta为各系数的回归检验统计量。其中t???0??0S??0,t?????1S??1;Lower95%,Upper95%为区间估计中各回归系数的置信上1/n?(x)/?(xi?x)2i?1n2??t(n?2)S

      限和置信下限,区间估计公式为:?0??2;??t(n?2)S?/?1?2?(xi?1ni?x)2?2?0.6117155.由上表知

      调整后的判定系数RR;F统计量为30.93318.回归系数T的统计量12.96.5.56.都显著。

      (二)(1)做散点图

      a.选择作图类型

      b.输入数据

      C确定标题

      d结果输出

      由图可知人均消费水平随着人均国内生产总值的增加大体也增加所以人均消费水平与国内生产总值是正线性相关。

      (2)相关系数

      人均国内生产总

      人均消费水平

      值

      人均国内生产总1值

      人均消费水平

      0.979641111由表可知人均国内生产总值与人均消费水平的相关系数为0,97964111,又r的绝对值越接近1,表明x与y的线性相关程度越密切。所以人均国内生产总值与人均消费水平的相关程度大。

      (3)

      人均消费水平与国内生产总值的回归方程为??724.7101?0.297415yx回归系数??724.7101??0.297415人均消费水平增加0.297415;??表示人均国内生产总值每增加一元,10表示即使在人均国内生产总值为0的情况下,人均消费水平平均为724.7101.4.R2=0.959697说明在人均消费水平Y的变动中,有95.9697%是由国内人均生产总值决定的。可见人均消费水平与人均国内生产总值之间有较强的线性关系,回归直线的拟合程度较高。

      5.第一步:提出假设。H0:?1=0(y不随x的变化而线性变化)

      H1:?1?0(l两个变量之间的线性关系显著)第二步:计算检验统计量F.SSR1=MSR=214.31F=SSEMSEn?2第三步:作出决策。将回归方差分析表中的P值与跟定的显著性水平α=-0.05进行比较,由于P值=1.39?10-7《α

      =0,。05,所以拒绝原假设。

      ??724.7101?0.2974156,由回归方程yx

      所以将x=5000带入的2211.7851,所以当某地区的人均GDP为5000元时,其人均消费水平为2211.7851.

      7.Lower95%,Upper95%为区间估计中各回归系数的置信上限和置信下限,区间估计公式为:??t(n?2)S?/?1?2??t(n?2)?0?2S?

      1/n?(x)/?(xi?x)2i?1n2;?(xi?1ni?x)2所以置信区间的下线为y=-289.461+0.251457×5000=967.824置信区间的下限为y=1738.881+0.343374×5000=3455.751所以当人均GDP为5000元时,在95%的置信水平下的置信区间为(967.824,3455.751)

      (三)1.在“工具”菜单中选择“数据分析”选项,从其“分析工具”列表中选择“移动平均”

      2.

      数据输入

      3.三项移动平均结果输出

      4,三项移动平均与五项移动平均对比结果

      DF列为移动的误差平方本例中3期移动的MSE为27.0267、五期移动的MSE为58.77241所以三期的移动平均的效果优于五期。

      5、第一步

      在“工具”菜单中选择“数据分析”选项,从其“分析工具”列表中选择“指数平滑”

      2输入数据

      3.

      结果

      α=0.3预测结果为511.2333α=0.预测结果为598.09814.

      参数的最小二乘估计-------回归模型的估计

      图像结果

      上表中的Coefficients列指系数,其中Intercept为截距,XVariable1为自变量;

      所以人均消费水平与国内生产总值的回归方程为?=613.86当x=2012则y???50450y.7?25.38x

      11考核结果

      教师签名

      年

      月

      日

      12

    篇四:相关与回归分析的实验报告

      

      实验三

      用EXCEL进行相关与回归分析

      一、实验题目:用EXCEL进行相关与回归分析

      二、实验教学目的用EXCEL进行相关与回归分析,并能够解释实验结果。

      三、实验教学要求:

      掌握利用EXCEL数据分析中提供的样本等进行相关和回归分析,并能够解释实验结果。

      四、实验内容:

      1.用Excel进行相关分析

      2.用Excel进行回归分析

      五、实验步骤

      1.用Excel进行相关分析

      第一步:打开一张工作表,并输入相应的数据,如A2:C10第二步:单击“工具”菜单→“数据分析”命令→选中“回归”功能,然后单击“确定”按钮,如图。

      第三步:在弹出的对话框中输入相应的参数,然后再单击“确定”按钮,如图。

      第四步:回归分析结果,即

      y

      5.2794x

      208.8235。2.用Excel进行回归分析

      第一步

      打开工作表,输入数据,然后单击“工具”菜单→“数据分析”命令→“相关系数”功能,然后单击“确定”按钮,如图。

      第二步:在方差分析对话框中,输入有关参数,再单击“确定”按钮,如图。

      第三步:

      获得相关系数r值,但在此无法明确该相关系数的显著性程度。

      第四步:显著性测验,由于,因此降水量与黏虫发生量之间有极显著的0.01相关性。

      r?r六、实验小结

    篇五:相关与回归分析的实验报告

      

      实姓

      名

      课程名称

      成

      绩

      验报告

      实验室

      学

      号

      统计分析与SPSS的应用

      专业班级

      指导教师

      实验名称

      SPSS的线性回归分析

      一、实验目的:掌握线性回归分析的基本思想和具体操作,能够读懂分析结果,并写出回归方程,对回归方程进行各种统计检验。

      二、实验题目:

      1.、某家电产品的需求量与价格及家庭平均收入水平密切相关。下表给出了某市近10年中该商品的年需求量与价格、家庭年平均收入的统计数据。用SPSS软件求该商品在该市的需求量对价格和家庭年平均收入水平的线性回归方程并进行显著性检验。

      需求量/万台

      价格/千元

      家庭平均收入/千元

      3.04.06.05.04.56.86.53.58.07.03.010.08.53.016.07.53.52010.02.5229.03.024112.52612.52.0282、一般认为,一个地区的农业总产值与该地区的农业劳动力、灌溉面积、化肥用量、农户固定资产、农业机械化水平等因素有关。下表为某年我国北方地区12个省市的相关数据。试建立我国北方地区的农业产出线性回归模型,分析影响农业产出的主要因素,并说明理由。

      地区

      农业总产农业劳动力灌溉面积化肥用量户均固定资农机动力值(亿元)(万人)

      (万公顷)

      (万吨)

      产(元)

      (万马力)

      19.6190.133.847.5394.3435.3北京

      14.495.234.953.9567.5450.7天津

      149.91639357.2692.4706.892712.6河北

      55.07562.6107.931.4856.371118.5山西

      60.85462.996.4915.41281.81641.7内蒙古

      87.48588.972.461.6844.741129.6辽宁

      73.81399.769.6336.92576.81647.6吉林

      104.51425.367.9525.81237.161305.8黑龙江

      276.552365.6456.55152.35812.023127.9山东

      200.022557.5318.99127.9754.782134.5河南

      68.18884.2117.936.1607.41764.0陕西

      49.12256.1260.4615.11143.67523.3新疆

      三、实验步骤(最好有截图):

      第一题

      1.建立“家电产品”SPSS数据。

      2.用SPSS求该商品在该市的需求量对价格和家庭年平均收入水平的线性回归方程并进行显著性检验。

      3.保存实验结果一数据。

      第二题:

      1.建立“农业产出”SPSS数据。

      2.用SPSS对我国北方地区的农业产出进行分析,并建立线性回归模型

      3.保存实验2结果。

      四、实验结果及分析(最好有截图):

      第一题

      实验结果:拟合优度系数接近1说明拟合好。回归方程的p值<0.05,说明显著线性。回归系数p值<0.05,说明显著线性。

      线性回归方程:y=11.167+0.17x1-1.903x2第二题

      实验结果分析:拟合优度系数接近1,说明拟合度好。存在多重线性。化肥用量p值<0.05.说明线性显著。线性回归方程:y=19.501+1.526x

    篇六:相关与回归分析的实验报告

      

      相公小学课程管理情况自查自纠报告

      学

      号:

      2014106146课

      程

      论

      文

      题

      目

      学

      数学与统计学院

      统计学实验

      院

      专

      金融数学

      业

      班

      14金融数学

      级

      学生罗星蔓

      姓名

      指导胡桂华

      教师

      职

      教授

      页脚内容1相公小学课程管理情况自查自纠报告

      称

      202页脚内容216年6月1日

      相公小学课程管理情况自查自纠报告

      相关与回归分析实验报告

      一、实验目的:用EXCEL进行相关分析和回归分析.

      二、实验内容:

      1.

      用EXCEL进行相关分析.

      2.

      用EXCEL进行回归分析.

      三、实验步骤

      采用下面的例子进行相关分析和回归分析.

      学生

      相关分析:

      896978945888592798399459382数学分数(x)

      统计学分数(y)

      数学分数(x)

      统计学分数(y)

      回归分析:

      数学分数(x)

      0.986011统计学分数(y)

      SUMMARYOUTPUT

      回归统计

      0.98MultipleR

      60110.97RSquare

      221AdjustedR0.96Square

      87442.40标准误差

      页脚内容3相公小学课程管理情况自查自纠报告

      观测值

      3141x

      df

      SS

      1616.6946.20061662.标准误差

      4.0.tStat

      2.16.73152方差分析

      回归分析

      残差

      总计

      MS

      1616.695.775086F

      279.943SignificanceF

      1.65E-0Coefficients

      12.320.896P-value

      0.1.65E-0Lower95%

      2.0.77321Upper95%

      221.020424下限

      95.0%

      2.0.77321上限

      95.0%

      22.204361.020424Intercept

      数学分数(x)

      012862782105360187433020691436005.20436436005RESIDUALOUTPUT

      观预测

      统计学测值

      分数(y)

      页脚内容

      残差

      0.934133-1.03403.870554-3.03400.727775-0.343610.965922-2.6771384.065893.034066.1294593.034082.2722390.3436193.034052.67713标准残差

      0.412293-0.45641.708324-1.339130.321214-0.151660.426323-1.1815相公小学课程管理情况自查自纠报告

      90.3436184.06582.656385-2.06581.172433-0.911PROBABILITYOUTPUT

      百分统计学比排位

      分数(y)

      5157258235834585559659759285939594学生成绩

      0246学生编号

      数学分数(x)ResidualPlot

      -2020406-4数学分数(x)

      页脚内容10080分数6040200数学分数(x)统计学分数(y)1012残差801005相公小学课程管理情况自查自纠报告

      数学分数(x)LineFitPlot100500050数学分数(x)100统计学分数(y)预测统计学分数(y)统计学分数(y)

      NormalProbabilityPlot100500020结果分析

      相关系数MultipleR=0.986011>0.8可以进行回归分析。

      ?与y的实际值相差2.403141。

      标准误差=2.403141,代表平均来看y统计学分数(y)4060SamplePercentile80100Intercept代表截距为12.32018即常数项

      XVariable1代表斜率为0.896821,即数学分数每增加1分,统计学分数平均增加0.896821分。

      x平均值为78.7,y平均值为92.9可以得出回归方程y=0.896821x+12.3201页脚内容6

    篇七:相关与回归分析的实验报告

      

      实验报

      告

      实验名称:

      数据整理与分析

      相关分析实验报告

      实验课程:

      统计学

      数据的整理与分析

      一、实验目的:

      学会运用Excel中次数分布表、透视表、统计图以及描述性统计功能来分析

      一组有调查意义的数据;从而通过分析得出有意义的结论以及推测预计。

      二、实验原理

      :

      次数分布表的制作过程,第一步找出最大、最小值,确定全距

      R;第二步利

      用斯透奇斯规则确定组数

      m,再根据组数与组距的关系确定组距;第三步分组,根据分组标志和分组上限确定在组内数据的频数以及频率。

      数据透视表,选中当

      前数据库表中人一个单元格,单击菜单中的“数据”—“数据透视表与数据透视

      图”。直方图是在平面坐标上一横轴根据各组组距的宽度标明各组组距,一纵轴

      根据次数的高度表示各组次数绘制成的统计图。

      折线图是在直方图的基础上,用

      折线连接各个直方形顶边中点并在直方图形两侧各延伸一组,使者限于横线相

      连。

      三、实验环境:

      实验地点:实训楼计算机实验中心五楼实验室

      3试验时间:第五周周二

      实验软件:MicrosoftExcel2003四、实验内容

      1、(1)在数据源中选取所需数据,对数据进行分析。利用

      Excel对数据进

      行描述性统计分析。实验内容包括:数据分组、直方图、描述性分析、透视表、实验结果分析。

      (2)数据资料:

      数据来源

      “9-33各地区农村居民家庭平均每人主要食品消费量

      (2008年)”

      如下图所示。

      2、实验步骤

      第一步:

      在数据库中把所要研究的数据对象复制黏贴到新建的Excel工作表

      sheet1中。我要研究的是“各地区农村居民家庭平均每人主要食品消

      费量(2008年)”挑选了其中的蔬菜。

      第二步:

      对sheet2中的数据进行分组。

      (1)

      找出这

      31个数据中的最大、最小值,得到全距

      R(2)

      其次利用斯透奇斯规则确定组数

      m,再根据组数与组距的关系确定组

      距i;

      (3)

      然后分组,根据分组标志和分组上限确定在组内数据的频数以及频

      率

      (4)

      最后得到全国各地区蔬菜消费量的次数分布表。

      第三步:

      数据分析

      (1)

      在

      Excel

      表工具栏中点开“加载宏”—“分析工具库”确认(如图);

      (2)

      再次打开工具栏“数据分析”

      —

      “描述统计”确定,得到对该组数据的描述性统计数据。

      以下截图为部分实验步骤:

      图1.1图1.2图1.3图1.4图1.5图1.6图1.图1.图1.图1.1图1.11图1.12图1.13图1.14图1.15图1.16五、实验结果

      :

      这次的实验是运用Excel的统计分析功能,进行数据的搜集整理和显示

      .并进

      行统计数据的录入、分组、汇总及各种常用统计图表的绘制,让我对数据的整理有了更深层次的理解,从而在有限经验样本的基础上实现对总体或现实世界的认识。

      先讲述下本次的实验过程。首先是对斯透奇斯公式的计算,m=1+3.322lgN,从以上实验数据中可以得出,N=31,代入公式后得出m=5.95.约等于6.所以组数

      为6组;组限R=Max-Min=Max(B3:B33)=Min(B3:B33)=162.79-20.57=142.22;组距i=R/m=142.22/6=23.7,所以得出i=25.

      其次根据算出来的分组标志进行分组。

      分成(20~45),(45~70),(70~95),(95~120),(120~145),(145~170)共六个组。根据“上组限不计入的原则”,在下方将每组的最大值一次排列为“44,69,94,119,144,169”.之后依次计算出“各组频数,各组频率,向上累计次数,向上累计频率,向下累计次数,向下累

      计频率”。

      接下来是FREQUENCY函数的应用。

      它的用途是以一列垂直数组返回某个区域中数据的频率分布。所以先选中D20:D25区域,然后在菜单栏上面点击“插入”,选择“插入函数”,将或选择类别改成“统计”,选择函数“FREQUENCY”,然

      后点击确定。在Dataarray中填入B:B,在Binsarray中填入E13:E18。则各组数据则显示出来,将每一列的数据加起来,看看是否与题目总提供的个数相同,确实为31.以此类推,将各组频率,向上累计次数,向上累计频率,向下累计次数,向下累计频率均填写完整。

      再次,点击“工具-加载宏-勾选分析数据库-确定”,然后,点击“工具

      -数

      据分析”,然后在数据分析中选择“描述统计”,点确定。将

      31个原始数据,输入到工作表中的B3:B33。然后步骤如下:第1步:选择“工具”下拉菜单。第

      2步:选择“数据分析”选项。第3步:在分析工具中选择“描述统计”

      。第4步:当出现对话框时,在“输入区域”方框内键入B3:B33;在“输出选项”中选择输出区域(在此选择“新工作表”);选择“汇总统计”(该选项给出全部描述统计量);选择“确定”最后得出这31个数的平均数92.4994,中位数93.85.标准差为34.269,方差1174.354等一系列数据。

      六、实验结果分析

      (运用理论分析实验结果)

      在这一组实验数据中,蔬菜的最大产量为162.79千克,最小为20.57千克,而平均值为92.4994千克,所以用平均值分析离散趋势还是不准确的。

      他不能准确估计平均水品,也让我们判断出不同地区的实际差距还是很大的。

      这个应该与各个地区的气候地域、环境是密切相关的,比如辽宁,这是一个土地肥沃适合农产种植的地方,而且近年来辽宁省很多地方农村采用保护地生产

      (以日光温室和大中小棚生产为主)与露地蔬菜栽培相结合的技术措施,一年四季均可栽培蔬菜,并获得优质高产,增加农民收入,满足城市居民蔬菜需求。那该地区的蔬菜人均消费量当然大大提高。

      而相对于那些土地贫瘠,农业生产相对资源不足,只能以拓展畜牧业为生的地区,人均蔬菜消费量肯定很低。

      而住在牧区的人他们吃得东西主要是藏族传统食物,在牧区的帐篷里,你才有机会吃到最好的酥油,最棒的酸奶.有些地理环境艰苦地方的牧民一年内可能吃得蔬菜很有限。

      然后在这组数据中中位数是第16个数,这就说明大部分地区消费量还是比较少,这就是因为各地之间的经济水平,蔬菜的产量不同而决定。

      要增加各个地区人均蔬菜消费量的话,除了积极开发当地的经济水平,多多调节南北之间的物资,还应多依靠科学技术,增加产量。

      7结论(验证理论、新发现、体会)在本次实验过程中,首先进行的就是对统计数据的输入与分析。

      这个输入过程并不轻松,既要细心又要用心。

      不仅仅是仔细的输入一组数据就可以,还要考虑到整个数据模型的要求,合理而正确的分配和输入数据。

      因此,输入正确的数据也就成为了整个统计实验的基础。

      数据输入后就是统计数据的描述与分析,这是整个统计实验关键中的关键。对统计数据的众数,中位数,均值的描述可以让我们对其有一个初步的印象和大体的了解,在此基础上的概率分析,抽样分析,方差分析,图形描述等则更具体和深刻的向我们揭示了统计数据的内在规律性。

      在对数据进行描述和分析的过程中,Excel软件的数据处理功能得到了极大的发挥,工具栏中的工具和数据功能对数据的处理是问题解决起来是事半功倍。

      所以EXCEL是我们统计试验的基础知识。若不知

      EXCEL的运用则无法进行试验。

      这一次的统计学实验是我大学生活中不可或缺的重要经历,它对我的学习以及将来工作生活中都有很大的帮助。

      其一,我可以将自己所学的知识应用于实践

      中,理论和实际是不可分的,在实践中理论知识得到了巩固与加强,解决问题的能力也受到了锻炼得以提升;

      其次,本次实验开阔了我的视野,使我对统计在现实中的运作有所了解,也对统计也有了进一步的掌握。

      统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。

      统计学是收集、处理、分析、解释数据并从数据中得出结论的科学,统计方法是适用于所有学科领域的通用数据分析方法,只要有数据的地方就会用到统计方法。通过运用统计学的数据分析,还可以方便我们日常生活中很多问题,比如

      CPI的增长,GDP的变化,可以让我们看出每年中国的变化,可以看出人们的生活水平的变化。因此学好统计学以及流利应用EXCEL进行实际操作对我们来说变

      的至关重要。

    篇八:相关与回归分析的实验报告

      

      实验报告

      课程名称

      统计学

      学号

      学生姓名

      辅导教师

      系别

      经济与管理学院

      1.实验名称

      相关与回归分析

      2.实验目的(1)熟练掌握相关关系的测定方法。

      (2)熟练掌握一元线性回归方程的建立和分析方法。

      3.实验内容

      (1)绘制相关散点图

      (2)利用相关系数宏计算相关变量的相关系数;

      (3)利用回归分析宏建立回归直线方程

      4.实验原理

      (1)利用Excel绘制相关图

      (2)利用Excel计算相关系数

      (3)利用Excel进行回归分析

      5.实验过程及步骤

      1、绘制散点图

      “插入”---“图表”---“xy散点图”----“下一步”---输入数据区域---“下一步”,输入图表标题“散点图”、数轴名称,“下一步”选择插入方式,“完成”

      2、相关系数的计算

      (1)使用相关系数函数进行计算

      在EXCEL中,CORREL函数和PERSON函数提供了计算两个变量之间的相关系数的方法,这两个函数是等价的。与相关系数有关的函数还有RSQ(相关系数的平方,即判定系数r2)和COVAR(协方差函数)。

      (2)利用相关系数宏计算相关系数矩阵

      点击EXCEL“工具”菜单,选择“数据分析”,选择“相关系数”。

      3、回归分析

      (1)使用回归分析宏

      步骤:“工具”---“数据分析”,在分析工具中选择“回归”然后“确定”,输入y值输入区域和x值输入区域,选择置信度,输出区域,选择确定。

      (2)除了回归分析宏外,EXCEL提供了9个函数用于建立回归模型和回归预测。这9个函数列于下表中。但EXCEL提供的回归分析宏仍然具有更方便的特点。

      实验室名称

      实验时间

      6.实验结论及心得

      一.(1)

      (2)

      由此可知,估计值为79,回归系数b为-2.33333.所以

      Y^=a+bx=79+(-2.33333)x(2)Y^=a+bx=79+(-2.33333)(x+1000)=-2.33333x-2254.33所以

      产量每增加1000,单位成本平均下降2333.33(3)当x=6000时,Y=-13920.98二.

      (1)

      (2)

      (3)由此可得

      回归直线方程为

      Y^=a+bx=50.27395+18.91731x

      我院任课教师有实验课的均要求有实验报告,每个实验项目要求有一份实验报告,实验报告按照格式书写完毕后,经辅

      导实验的教师批改后按照实验室收集存档。

    推荐访问:相关与回归分析的实验报告 回归 实验 报告

    Top