學術堂首頁 | 文獻求助論文范文 | 論文題目 | 參考文獻 | 開題報告 | 論文格式 | 摘要提綱 | 論文致謝 | 論文查重 | 論文答辯 | 論文發表 | 期刊雜志 | 論文寫作 | 論文PPT
學術堂專業論文學習平臺您當前的位置:學術堂 > 論文寫作 > 碩士論文寫作

在論文中用多元回歸分析(實例介紹)

時間:2020-04-29 來源:MBA學位論文研究及寫作指導 本文字數:1852字
作者:李懷祖 單位:

  多元回歸分析是描述多個自變量和一個因變量之間線性關系的分析方法,它根據樣本數據估計回歸系數(權重)來構建回歸方程,從而可以根據多個預測變量(自變量)的數值來預測準則變量(因變量)的數值。如公司根據本城市的新建房面積、新結婚人數和年可支配收人增長數來預測居民樓房銷售額。又如預測一年后職工績效,可以用能力測試成績、面試分數、工作經歷和教育水平等變量。多元回歸分析運用多個自變量去預測某個準則變量,較之單一自變量預測,一般說來總是更準確一些。方程中包含的各個變量,應盡可能互不相關,各個變量都獨立地對因變量作出貢獻。由于多元回歸分析的簡易性和普適性,其在管理研究中得到廣泛的應用。

  回歸方程的各個變量一般都要求定距和定比尺度,盡管有時可引入定類尺度變量(0,1變量)。自變量與因變量關系的數學表達式為:

  

  式中,b0為常數,即所有自變量為零時Y的數值;

  bi為相應于每個自變量xi的回歸系數,代表回歸曲面的斜率;

  為誤差項,正常情況下取值按均值為0分布,計算時一般可設為0。

  回歸系數可以是原值bi,(即x的實際值) ,也可以是標準化后的數值,標準化后的回歸系數一般用表示。不論是原值還是標準化值,回歸系數都表示x變量每變化一個單位,Y相應的變化值。標準化后的系數具有權重的含義,表示各x變量相對的重要程度,如=0.60,=0. 30,則表示X1對Y的影響是X2的兩倍。但采用原值的情況下,各回歸系數bi,值的大小不能說明變量對Y的相對影響大小。

  現舉例說明。

  算例 某企業預測電子商務網站用戶數,選擇成本速度比(X1)、安全性(X2)、可靠性(X3)作為自變量。

  利用統計軟件SPSS處理該回歸方程。SPSS和其他統計軟件一樣,提供選擇自變量的方法,變量篩選一般有兩種途徑,一種是較通用的逐項添加法,從一元回歸分析開始,逐步加入那些引起相關系數增幅最大,對因變量最有解釋意義的自變量。另一種是消去法,先構建研究者認為重要的多個獨立變量的回歸方程,然后從中刪去那些引起變化最小的變量。

  逐步添加法的計算過程用一個算例來表示(表5-18)。

  

  表5-18中的變量篩選部分,表明有三個模型。模型1引入第一個變量,成本速度比。模型2加入安全性變量,模型3再加上可靠性共三個變量。從表中可以看出,模型1調整后的=0.771,表示成本速度比這個變量與因變量用戶數的協同變異部分占77.1%。模型2引入安全性變量后,兩個變量的協同變異部分提高到85.4%。模型3加上可靠性變量后只提高約2% ,協同變異部分達到87.1%。

  對表中的數據作幾點說明:

 、僬{整后。調整的目的,是使該與自變量個數不同的其他模型具有可比性,變量個數越多,調整下降幅度越大,如模型3的從0.873降到0.871。

 、跇藴什σ。表示Y的實際值與按回歸方程估計的9值的標準差。如模型3的標準差σ=0.493 7。

 、鄯讲罘治鲇脕砼袛喾匠讨械囊唤M回歸系數,從整體上看是否偏離0,F臨界值從附表3查出,分子的自由度為k,即自變量的個數,本例分別為(1,2,3),分母自由度為n-k-1,n即樣本數(觀察值),本例為183, 故對于模型3,自由度df=183-3-1=179。顯著度a=0.05時,查附表3得知,F的臨界值為8.55,表5-18中算出的F值均大于臨界值,且概率均小于0.05,說明統計檢驗支持回歸系數偏離0。

 、鼙5-18的第二部分表示三個模型的回歸系數。“b” 表示由原始x值估計出的回歸系數,模型3的數學表達式為:

  Y =-0.093 + 0.448X1, + 0.315X2 + 254X3 +e

 、"β"列表示標準化后的回歸系數。標準化后,常數項即回歸線截距為0。一般情況下,各變量都是按不同尺度賦值,標準化后的β表示各個自變量對因變量解釋能力的相對貢獻,使各回歸系數之間具有可比性。本例中,成本速度比較之其他兩個變量解釋能力要大(0.46>0. 321 ,0. 236)。

 、廾總回歸系數都有標準差,衡量每個回歸系數的樣本變異狀況。

 、“t”列表示各回歸系數的顯著性檢驗值,按各變量的自由度查附表,三個自變量的系數值統計上都顯著偏離0。

  表5-18的回歸方程表示因變量網站用戶與成本速度比、安全性和可靠性等自變量之間的關系,回歸系數按整體和個別統計檢驗結果,其值都顯著偏離0。其中,成本速度比對客戶量影響最大,后面順次為安全性和可靠性。

  有些回歸方程中,自變量之間相關性較強,影響多元回歸分析的效果,使得不同的樣本,估計出的系數波動較大,用系數來表示各變量的權重就不可靠?山邮艿淖宰兞肯嚓P程度是多少,要看情況而定,如果相關系數達到0.8以上,應加以處理,或者從兩個相關變量中刪去一量,或者引人一個能代替這兩個相關變量的新變量。統計表5-18中有一列“共線性值VIF”即變量貶值指標,它測量其他自變量對該回歸系數的影響,此值如等于或大于10,則看作存在共線性( collinearity,mulicollinearity) ,本例中該值均遠小于10,不存在該問題。

  原文出處:李懷祖.MBA學位論文研究及寫作指導[M].重慶:重慶大學出版社,2018.124-126.
相關標簽:
  • 成都網絡警察報警平臺
  • 公共信息安全網絡監察
  • 經營性網站備案信息
  • 不良信息舉報中心
  • 中國文明網傳播文明
  • 學術堂_誠信網站
买股票的软件