
![[學習]概率論與數理統(tǒng)計課件第9章_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-9/19/23/1573946b-c050-4a27-b879-768e6b08c081/1573946b-c050-4a27-b879-768e6b08c0811.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、一元回歸分析,在現實問題中,處于同一個過程中的一些變量,往往是相互依賴和相互制約的,它們之間的相互關系大致可分為兩種:,相關關系問題,(1)確定性關系——函數關系;,(2)非確定性關系——相關關系;,相關關系表現為這些變量之間有一定的依賴關系,但這種關系并不完全確定,它們之間的關系不能精確地用函數表示出來,這些變量其實是隨機變量,或至少有一個是隨機變量。,相關關系舉例,例如:在氣候、土壤、水利、種子和耕作技術等條件基本相同時,某農作物的
2、畝產量 Y 與施肥量 X 之間有一定的關系,但施肥量相同,畝產量卻不一定相同。畝產量是一個隨機變量。,又如:人的血壓 Y 與年齡 X 之間有一定的依賴關系,一般來說,年齡越大,血壓越高,但年齡相同的兩個人的血壓不一定相等。血壓是一個隨機變量。,農作物的畝產量與施肥量、血壓與年齡之間的這種關系稱為相關關系,在這些變量中,施肥量、年齡是可控變量,畝產量、血壓是不可控變量。一般在討論相關關系問題中,可控變量稱為自變量,不可控變量稱為因變量。,
3、函數關系與相關關系的區(qū)別,相關關系——,影響,的值,,函數關系——,決定,的值,,因此,統(tǒng)計學上討論兩變量的相關關系時,是設法確定:在給定自變量 的條件下,因變量 的條件數學期望,不能確定。,回歸分析的概念,研究一個隨機變量與一個(或幾個)可控變量之間的相關關系的統(tǒng)計方法稱為回歸分析。,只有一個自變量的回歸分析稱為一元回歸分析;多于一個自變量的回歸分析稱為多元回歸分析。,引進回歸函數,稱為回歸方程,回歸分析主要包
4、括三方面的內容,(1)提供建立有相關關系的變量之間的數學關系式(稱為經驗公式)的一般方法;,(2)判別所建立的經驗公式是否有效,并從影響隨機變量的諸變量中判別哪些變量的影響是顯著的,哪些是不顯著的;,回歸分析的內容,(3)利用所得到的經驗公式進行預測和控制。,一元線性回歸模型,如果試驗的散點圖中各點呈直線狀,則假設這批數據的數學模型為,設隨機變量Y依賴于自變量x,作n次獨立試驗,得n對觀測值:稱這n對觀測值為容量為n的一個子樣,若
5、把這n對觀測值在平面直角坐標系中描點,得到試驗的散點圖.,則,,,,圖 9-1,,因此,其中 是與 無關的未知常數。,(9.1),一元線性回歸模型,一般地,稱如下數學模型為一元線性模型,而 稱為回歸函數或回歸方程。,稱為回歸系數。,回歸函數(方程)的建立,由觀測值 確定的回歸函數 ,應使得
6、 較小。,考慮函數,問題:確定 ,使得 取得極小值。,這是一個二元函數的無條件極值問題。,回歸方程的建立,令,,,,回歸方程的建立,記,表示對 的估計值,則變量 對 的回歸方程為,簡寫為,,最小二乘法,回歸方程有效性的檢驗,對于任何一組數據 ,都可按最小二乘法確定一個線性函數,但變量 與 之間是否真有近似于線性函數的相關關系呢?尚需進行假設檢驗
7、。,假設,如果 成立,則不能認為 與 有線性相關關系。,三種檢驗方法:F檢驗法、t-檢驗法、r檢驗法。,,,,,回歸方程有效性的F檢驗法,記,——總離差平方和,反映觀測值與平均值的偏差程度。,經恒等變形,將 分解,,,,,回歸方程有效性的F檢驗法,——回歸平方和,反映回歸值與平均值的偏差,揭示變量 與 的線性關系所引起的數據波動。,——剩余平方和,反映觀測值與回歸值的偏差,揭示試驗誤差和非線性關系對試驗結果所引
8、起的數據波動。,,,,,回歸方程有效性的F檢驗法,如果 為真,則,于是,統(tǒng)計量,對給定的檢驗水平 ,,(1)當 時,拒絕 ,即可認為變量 與 有線性相關關系;,(2)當 時,接受 ,即可認為變量 與 沒有線性相關關系;,回歸方程有效性的F檢驗法,(2)當 時,接受 ,即可認為變量 與 沒有線性相關關系;,此時,可能有以下幾種情況:,(2) 對
9、 有顯著影響,但這種影響不能用線性關系表示,應作非線性回歸;,(3)除 之外,還有其它變量對 也有顯著影響,從而削弱了 對 的影響,應考慮多元回歸。,(1) 對 沒有顯著影響,應丟棄自變量 ;,回歸方程有效性的r檢驗法,記,——樣本的相關系數,可反映變量 與 之間的線性相關程度。,因為,回歸方程有效性的r檢驗法,記,——樣本的相關系數,越大,變量 與 之間的線性相關程度越強。,因為,(1),(2) 時
10、,,(3) 時,,與 有線性相關關系;,與 無線性相關關系;,回歸方程有效性的r檢驗法,計算,對給定的檢驗水平 ,查相關系數的臨界值表,如果 ,則拒絕 ,即線性回歸方程有效;否則,接受 ,即線性回歸方程無效。,F檢驗與r檢驗是一致的:,回歸方程有效性的t檢驗法,統(tǒng)計量,H0成立時,,對給定的檢驗水平 ,H0的拒絕域為,即當 時,變量 與 有線性相關關系。,F檢驗與t檢
11、驗是一致的:,,試求出 與 的關系,并判斷是否有效。,例1 為了研究大豆脂肪含量 和蛋白質含量 的關系,測定了九種大豆品種籽粒內的脂肪含量和蛋白質含量,得到如下數據,解 (1)描散點圖,(2)建立模型,由散點圖,設變量 與 為線性相關關系:,確定回歸系數 和 :,所以,所求的回歸方程為,(3)檢驗回歸方程的有效性,查相關系數臨界值表,因為,所以回歸方程在 的檢驗水平下有統(tǒng)計意義。,即可以認為大豆的蛋白
12、質含量與脂肪含量有線性相關性。,利用回歸方程進行預測,1、點預測,時, 即為 的點預測值。,2、區(qū)間預測,統(tǒng)計量,對給定的置信水平 , 的預測區(qū)間為,,續(xù)例1 求大豆脂肪含量為18.6%的條件下蛋白質95%的預測區(qū)間。,解 由已求得的回歸方程,得蛋白質的點預測值為,所以脂肪含量為18.6%時,蛋白質的95%的預測區(qū)間為,利用回歸方程進行預測,控制則為預測的反問題:已知因變量的取值區(qū)間為,,確定自變量
13、的取值區(qū)間 使得,利用回歸方程進行控制,一般地,要解出 和 很復雜,可作簡化求解:,當樣本容量很大時,,,則,例1的上機操作步驟,分兩列輸入,回歸分析命令,,因變量,自變量,,預測點,置信水平,,,,,,,,t檢驗,r檢驗,F檢驗,,,預測區(qū)間,點預測值,,自變量值,,可線性化的一元非線性回歸,多重線性回歸簡介,前一節(jié),我們學習了一元線性回歸分析問題,在實際應用中,有些變量之間并不是線性相關關系,但可以經過適當的變
14、換,把非線性回歸問題轉化為線性回歸問題。,可線性化的一元非線性回歸,常見的幾種變換形式:,1、雙曲線,令,,2、冪函數曲線,令,,化非線性回歸為線性回歸,變形,3、指數函數曲線,令,,變形,4、負指數函數曲線,令,,化非線性回歸為線性回歸,變形,5、對數函數曲線,令,,6、S型(Logistic)曲線,令,,化非線性回歸為線性回歸,變形,例1 測定某肉雞的生長過程,每兩周記錄一次雞的重量,數據如下表,由經驗知雞的生長曲線為Logi
15、stic曲線,且極限生長量為k=2.827,試求y對x的回歸曲線方程。,解 由題設可建立雞重y與時間x的相關關系為,令,則有,列表計算,所以,所以所求曲線方程為,上機操作,輸入原始數據,上機操作,計算,上機操作,上機操作,上機操作,是y*,而不是y,,自變量,上機操作,,,回歸方程,還要回代系數,多重回歸分析,在實際問題中,自變量的個數可能多于一個,隨機變量 y與多個可控變量x1,x2,x3,…,xk之間是否存在相關關系,則屬于多重
16、(元)回歸問題。本節(jié)討論多重線性回歸。,多重線性回歸模型,隨機變量 與 之間的線性關系,(1),其中,未知,則(1)式稱為多重線性回歸模型。,多重線性回歸模型,若對變量 與 分別作n次觀測,則可得一個容量為n的子樣,(2),其中,為待定參數,稱為回歸系數。,(2)式含有k+1個參數,故觀測次數應滿足n>k+1。,則有,多重線性回歸模型的矩
17、陣形式,記,則(2)有矩陣形式,其中,確定 的最小二乘法,考慮多元函數,目標:確定 使 最小,方法:,解得,——多重線性回歸方程,線性回歸方程的有效性檢驗——方差分析法,線性回歸方程是否有統(tǒng)計意義,可檢驗假設,是否成立,方法:方差分析法,將總離差平方和分解,線性回歸方程的有效性檢驗——方差分析法,——回歸平方和,反映線性關系對觀測結果產生的數據波動,S
18、SR越大,線性相關關系越強。,——剩余平方和(或殘差平方和),反映除線性因素之外的其它因素對觀測結果產生的數據波動,SSE越大,則其它因素對Y的影響越大。,線性回歸方程的有效性檢驗——方差分析法,在H0成立的條件下,可以證明:,(n為觀測次數,k為自變量個數),構造F統(tǒng)計量,當 時,拒絕H0。,回歸系數的統(tǒng)計檢驗,回歸方程的有效性檢驗,只是解決了 與之
19、間是否有線性相關關系,至于變量 對 的影響是否有統(tǒng)計意義,無從看出,因此,還需對回歸系數 是否為0作統(tǒng)計檢驗。,提出假設,如果H0成立,可以證明統(tǒng)計量,當 時,拒絕H0。,利用回歸方程作預測及控制,對于給定的,點估計值,置信水平為 的預測區(qū)間為,例2 某種水泥在凝固時放出的熱量Y(cal/g)與水泥中下列4種化學成分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- [學習]概率論與數理統(tǒng)計課件第5章
- 概率論與數理統(tǒng)計第9章題庫
- [學習]概率論與數理統(tǒng)計課件第4章
- [學習]概率論與數理統(tǒng)計課件第6章
- [學習]概率論與數理統(tǒng)計課件第10章
- [學習]概率論與數理統(tǒng)計課件第3章
- [學習]概率論與數理統(tǒng)計課件第1章
- [學習]概率論與數理統(tǒng)計課件第8章
- [學習]概率論與數理統(tǒng)計課件(第3-5章)
- 概率論與數理統(tǒng)計第章題庫
- 概率論與數理統(tǒng)計第8章題庫
- 概率論與數理統(tǒng)計-第5章new
- [學習]概率論與數理統(tǒng)計第五章
- 概率論與數理統(tǒng)計
- [學習]概率論與數理統(tǒng)計課件(第二章第3節(jié))
- [學習]概率論與數理統(tǒng)計柴中林第9講
- [學習]概率論與數理統(tǒng)計課件(第二章第1節(jié))
- [學習]概率論與數理統(tǒng)計課件(第一章第4節(jié))
- [學習]概率論與數理統(tǒng)計課件(第一章第3節(jié))
- 概率論與數理統(tǒng)計同濟大學第2章
評論
0/150
提交評論