簡介:第三章經(jīng)典單方程計(jì)量經(jīng)濟(jì)學(xué)模型多元線性回歸模型,多元線性回歸模型多元線性回歸模型的參數(shù)估計(jì)多元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)多元線性回歸模型的預(yù)測(cè)回歸模型的其他形式回歸模型的參數(shù)約束,§31多元線性回歸模型,一、多元線性回歸模型二、多元線性回歸模型的基本假定,一、多元線性回歸模型,多元線性回歸模型表現(xiàn)在線性回歸模型中的解釋變量有多個(gè)。一般表現(xiàn)形式,I1,2,N,其中K為解釋變量的數(shù)目,?J稱為回歸參數(shù)(REGRESSIONCOEFFICIENT)。,也被稱為總體回歸函數(shù)的隨機(jī)表達(dá)形式。它的非隨機(jī)表達(dá)式為,表示各變量X值固定時(shí)Y的平均響應(yīng)。,習(xí)慣上把常數(shù)項(xiàng)看成為一虛變量的系數(shù),該虛變量的樣本觀測(cè)值始終取1。于是模型中解釋變量的數(shù)目為(K1),總體回歸模型N個(gè)隨機(jī)方程的矩陣表達(dá)式為,其中,?J也被稱為偏回歸系數(shù),表示在其他解釋變量保持不變的情況下,XJ每變化1個(gè)單位時(shí),Y的均值EY的變化或者說?J給出了XJ的單位變化對(duì)Y均值的“直接”或“凈”(不含其他變量)影響。,用來估計(jì)總體回歸函數(shù)的樣本回歸函數(shù)為,其隨機(jī)表示式,EI稱為殘差或剩余項(xiàng)RESIDUALS,可看成是總體回歸函數(shù)中隨機(jī)擾動(dòng)項(xiàng)?I的近似替代。樣本回歸函數(shù)的矩陣表達(dá),或,其中,二、多元線性回歸模型的基本假定,假設(shè)1,解釋變量是非隨機(jī)的或固定的,且各X之間互不相關(guān)(無多重共線性)。假設(shè)2,隨機(jī)誤差項(xiàng)具有零均值、同方差及不序列相關(guān)性。,假設(shè)3,解釋變量與隨機(jī)項(xiàng)不相關(guān),假設(shè)4,隨機(jī)項(xiàng)滿足正態(tài)分布,上述假設(shè)的矩陣符號(hào)表示式,假設(shè)1,N?K1矩陣X是非隨機(jī)的,且X的秩?K1,即X滿秩。假設(shè)2,,假設(shè)4,向量?有一多維正態(tài)分布,即,同一元回歸一樣,多元回歸還具有如下兩個(gè)重要假設(shè)假設(shè)5,樣本容量趨于無窮時(shí),各解釋變量的方差趨于有界常數(shù),即N?∞時(shí),,假設(shè)3,EX’?0,即,其中Q為一非奇異固定矩陣,矩陣X是由各解釋變量的離差為元素組成的N?K階矩陣,假設(shè)6,回歸模型的設(shè)定是正確的。,或,§32多元線性回歸模型的估計(jì),一、普通最小二乘估計(jì)二、最大或然估計(jì)三、矩估計(jì)四、參數(shù)估計(jì)量的性質(zhì)五、樣本容量問題六、估計(jì)實(shí)例,說明,估計(jì)方法3大類方法OLS、ML或者M(jìn)M在經(jīng)典模型中多應(yīng)用OLS在非經(jīng)典模型中多應(yīng)用ML或者M(jìn)M在本節(jié)中,ML與MM為選學(xué)內(nèi)容,一、普通最小二乘估計(jì),對(duì)于隨機(jī)抽取的N組觀測(cè)值,如果樣本函數(shù)的參數(shù)估計(jì)值已經(jīng)得到,則有,I1,2N,根據(jù)最小二乘原理,參數(shù)估計(jì)值應(yīng)該是右列方程組的解,其中,于是得到關(guān)于待估參數(shù)估計(jì)值的正規(guī)方程組,,,□正規(guī)方程組的矩陣形式,即,由于X’X滿秩,故有,將上述過程用矩陣表示如下,即求解方程組,得到,于是,例321在例211的家庭收入消費(fèi)支出例中,,可求得,于是,?正規(guī)方程組的另一種寫法,對(duì)于正規(guī)方程組,于是,或,或()是多元線性回歸模型正規(guī)方程組的另一種寫法。,,,,?樣本回歸函數(shù)的離差形式,I1,2N,其矩陣形式為,其中,在離差形式下,參數(shù)的最小二乘估計(jì)結(jié)果為,?隨機(jī)誤差項(xiàng)?的方差?的無偏估計(jì),可以證明,隨機(jī)誤差項(xiàng)?的方差的無偏估計(jì)量為,二、最大或然估計(jì),對(duì)于多元線性回歸模型,易知,Y的隨機(jī)抽取的N組樣本觀測(cè)值的聯(lián)合概率,對(duì)數(shù)或然函數(shù)為,對(duì)對(duì)數(shù)或然函數(shù)求極大值,也就是對(duì),求極小值。,即為變量Y的或然函數(shù),因此,參數(shù)的最大或然估計(jì)為,結(jié)果與參數(shù)的普通最小二乘估計(jì)相同,三、矩估計(jì)(MOMENTMETHOD,MM),OLS估計(jì)是通過得到一個(gè)關(guān)于參數(shù)估計(jì)值的正規(guī)方程組,并對(duì)它進(jìn)行求解而完成的。,該正規(guī)方程組可以從另外一種思路來導(dǎo),求期望,稱為原總體回歸方程的一組矩條件,表明了原總體回歸方程所具有的內(nèi)在特征。,矩方法是工具變量方法INSTRUMENTALVARIABLES,IV和廣義矩估計(jì)方法GENERALIZEDMOMENTMETHOD,GMM的基礎(chǔ),在矩方法中利用了關(guān)鍵是EX’?0,如果某個(gè)解釋變量與隨機(jī)項(xiàng)相關(guān),只要能找到1個(gè)工具變量,仍然可以構(gòu)成一組矩條件。這就是IV。如果存在>K1個(gè)變量與隨機(jī)項(xiàng)不相關(guān),可以構(gòu)成一組包含>K1方程的矩條件。這就是GMM。,四、參數(shù)估計(jì)量的性質(zhì),在滿足基本假設(shè)的情況下,其結(jié)構(gòu)參數(shù)?的普通最小二乘估計(jì)、最大或然估計(jì)及矩估計(jì)仍具有線性性、無偏性、有效性。,同時(shí),隨著樣本容量增加,參數(shù)估計(jì)量具有漸近無偏性、漸近有效性、一致性。,1、線性性,其中,CX’X1X’為一僅與固定的X有關(guān)的行向量,2、無偏性,3、有效性(最小方差性),這里利用了假設(shè)EX’?0,其中利用了,和,五、樣本容量問題,所謂“最小樣本容量”,即從最小二乘原理和最大或然原理出發(fā),欲得到參數(shù)估計(jì)量,不管其質(zhì)量如何,所要求的樣本容量的下限。,⒈最小樣本容量,樣本最小容量必須不少于模型中解釋變量的數(shù)目(包括常數(shù)項(xiàng)),即N≥K1因?yàn)?,無多重共線性要求秩XK1,2、滿足基本要求的樣本容量,從統(tǒng)計(jì)檢驗(yàn)的角度N?30時(shí),Z檢驗(yàn)才能應(yīng)用;NK≥8時(shí),T分布較為穩(wěn)定,一般經(jīng)驗(yàn)認(rèn)為當(dāng)N≥30或者至少N≥3K1時(shí),才能說滿足模型估計(jì)的基本要求。,模型的良好性質(zhì)只有在大樣本下才能得到理論上的證明,六、多元線性回歸模型的參數(shù)估計(jì)實(shí)例,例322在例251中,已建立了中國居民人均消費(fèi)一元線性模型。這里我們?cè)倏紤]建立多元線性模型。,解釋變量人均GDPGDPP前期消費(fèi)CONSP1,估計(jì)區(qū)間19792000年,EVIEWS軟件估計(jì)結(jié)果,§33多元線性回歸模型的統(tǒng)計(jì)檢驗(yàn),一、擬合優(yōu)度檢驗(yàn)二、方程的顯著性檢驗(yàn)F檢驗(yàn)三、變量的顯著性檢驗(yàn)(T檢驗(yàn))四、參數(shù)的置信區(qū)間,一、擬合優(yōu)度檢驗(yàn),1、可決系數(shù)與調(diào)整的可決系數(shù),則,總離差平方和的分解,由于,0,所以有,注意一個(gè)有趣的現(xiàn)象,,可決系數(shù),該統(tǒng)計(jì)量越接近于1,模型的擬合優(yōu)度越高。,問題在應(yīng)用過程中發(fā)現(xiàn),如果在模型中增加一個(gè)解釋變量,R2往往增大(WHY這就給人一個(gè)錯(cuò)覺要使得模型擬合得好,只要增加解釋變量即可。但是,現(xiàn)實(shí)情況往往是,由增加解釋變量個(gè)數(shù)引起的R2的增大與擬合好壞無關(guān),R2需調(diào)整。,調(diào)整的可決系數(shù)(ADJUSTEDCOEFFICIENTOFDETERMINATION),在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所以調(diào)整的思路是將殘差平方和與總離差平方和分別除以各自的自由度,以剔除變量個(gè)數(shù)對(duì)擬合優(yōu)度的影響,其中NK1為殘差平方和的自由度,N1為總體平方和的自由度。,2、赤池信息準(zhǔn)則和施瓦茨準(zhǔn)則,為了比較所含解釋變量個(gè)數(shù)不同的多元回歸模型的擬合優(yōu)度,常用的標(biāo)準(zhǔn)還有赤池信息準(zhǔn)則(AKAIKEINFORMATIONCRITERION,AIC),施瓦茨準(zhǔn)則(SCHWARZCRITERION,SC),這兩準(zhǔn)則均要求僅當(dāng)所增加的解釋變量能夠減少AIC值或AC值時(shí)才在原模型中增加該解釋變量。,EVIEWS的估計(jì)結(jié)果顯示中國居民消費(fèi)一元例中AIC668AC683中國居民消費(fèi)二元例中AIC709AC719從這點(diǎn)看,可以說前期人均居民消費(fèi)CONSP1應(yīng)包括在模型中。,二、方程的顯著性檢驗(yàn)F檢驗(yàn),方程的顯著性檢驗(yàn),旨在對(duì)模型中被解釋變量與解釋變量之間的線性關(guān)系在總體上是否顯著成立作出推斷。,1、方程顯著性的F檢驗(yàn),即檢驗(yàn)?zāi)P蚘I?0?1X1I?2X2I??KXKI?II1,2,?,N中的參數(shù)?J是否顯著不為0。,可提出如下原假設(shè)與備擇假設(shè),H0?0?1?2??K0H1?J不全為0,F檢驗(yàn)的思想來自于總離差平方和的分解式TSSESSRSS,如果這個(gè)比值較大,則X的聯(lián)合體對(duì)Y的解釋程度高,可認(rèn)為總體存在線性關(guān)系,反之總體上可能不存在線性關(guān)系。因此,可通過該比值的大小對(duì)總體線性關(guān)系進(jìn)行推斷。,根據(jù)數(shù)理統(tǒng)計(jì)學(xué)中的知識(shí),在原假設(shè)H0成立的條件下,統(tǒng)計(jì)量,服從自由度為K,NK1的F分布。,給定顯著性水平?,可得到臨界值F?K,NK1,由樣本求出統(tǒng)計(jì)量F的數(shù)值,通過F?F?K,NK1或F≤F?K,NK1來拒絕或接受原假設(shè)H0,以判定原方程總體上的線性關(guān)系是否顯著成立。,對(duì)于中國居民人均消費(fèi)支出的例子一元模型F28592二元模型F20573,給定顯著性水平?005,查分布表,得到臨界值一元例F?1,21432二元例F?2,19352,顯然有F?F?K,NK1,即二個(gè)模型的線性關(guān)系在95的水平下顯著成立。,2、關(guān)于擬合優(yōu)度檢驗(yàn)與方程顯著性檢驗(yàn)關(guān)系的討論,由,可推出,與,或,在中國居民人均收入消費(fèi)一元模型中,,在中國居民人均收入消費(fèi)二元模型中,,三、變量的顯著性檢驗(yàn)(T檢驗(yàn)),方程的總體線性關(guān)系顯著?每個(gè)解釋變量對(duì)被解釋變量的影響都是顯著的。因此,必須對(duì)每個(gè)解釋變量進(jìn)行顯著性檢驗(yàn),以決定是否作為解釋變量被保留在模型中。這一檢驗(yàn)是由對(duì)變量的T檢驗(yàn)完成的。,1、T統(tǒng)計(jì)量,由于,以CII表示矩陣X’X1主對(duì)角線上的第I個(gè)元素,于是參數(shù)估計(jì)量的方差為,其中?2為隨機(jī)誤差項(xiàng)的方差,在實(shí)際計(jì)算時(shí),用它的估計(jì)量代替,因此,可構(gòu)造如下T統(tǒng)計(jì)量,2、T檢驗(yàn),設(shè)計(jì)原假設(shè)與備擇假設(shè),H1?I?0,給定顯著性水平?,可得到臨界值T?/2NK1,由樣本求出統(tǒng)計(jì)量T的數(shù)值,通過|T|?T?/2NK1或|T|≤T?/2NK1來拒絕或接受原假設(shè)H0,從而判定對(duì)應(yīng)的解釋變量是否應(yīng)包括在模型中。,H0?I0(I1,2K),注意一元線性回歸中,T檢驗(yàn)與F檢驗(yàn)一致,一方面,T檢驗(yàn)與F檢驗(yàn)都是對(duì)相同的原假設(shè)H0?10進(jìn)行檢驗(yàn)另一方面,兩個(gè)統(tǒng)計(jì)量之間有如下關(guān)系,在中國居民人均收入消費(fèi)支出二元模型例中,由應(yīng)用軟件計(jì)算出參數(shù)的T值,給定顯著性水平?005,查得相應(yīng)臨界值T0025192093。,可見,計(jì)算的所有T值都大于該臨界值,所以拒絕原假設(shè)。即包括常數(shù)項(xiàng)在內(nèi)的3個(gè)解釋變量都在95的水平下顯著,都通過了變量顯著性檢驗(yàn)。,四、參數(shù)的置信區(qū)間,參數(shù)的置信區(qū)間用來考察在一次抽樣中所估計(jì)的參數(shù)值離參數(shù)的真實(shí)值有多“近”。在變量的顯著性檢驗(yàn)中已經(jīng)知道,容易推出在1?的置信水平下?I的置信區(qū)間是,其中,T?/2為顯著性水平為?、自由度為NK1的臨界值。,在中國居民人均收入-消費(fèi)支出二元模型例中,給定?005,查表得臨界值T0025192093,計(jì)算得參數(shù)的置信區(qū)間?044284,197116?100937,03489?200951,08080,從回歸計(jì)算中已得到,如何才能縮小置信區(qū)間,增大樣本容量N,因?yàn)樵谕瑯拥臉颖救萘肯?,N越大,T分布表中的臨界值越小,同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減??;提高模型的擬合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型優(yōu)度越高,殘差平方和應(yīng)越小。,提高樣本觀測(cè)值的分散度,一般情況下,樣本觀測(cè)值越分散,X’X1的分母的|X’X|的值越大,致使區(qū)間縮小。,§34多元線性回歸模型的預(yù)測(cè),一、EY0的置信區(qū)間二、Y0的置信區(qū)間,對(duì)于模型,給定樣本以外的解釋變量的觀測(cè)值X01,X10,X20,,XK0,可以得到被解釋變量的預(yù)測(cè)值,它可以是總體均值EY0或個(gè)值Y0的預(yù)測(cè)。但嚴(yán)格地說,這只是被解釋變量的預(yù)測(cè)值的估計(jì)值,而不是預(yù)測(cè)值。為了進(jìn)行科學(xué)預(yù)測(cè),還需求出預(yù)測(cè)值的置信區(qū)間,包括EY0和Y0的置信區(qū)間。,一、EY0的置信區(qū)間,易知,容易證明,于是,得到1?的置信水平下EY0的置信區(qū)間,其中,T?/2為1?的置信水平下的臨界值。,二、Y0的置信區(qū)間,如果已經(jīng)知道實(shí)際的預(yù)測(cè)值Y0,那么預(yù)測(cè)誤差為,容易證明,E0服從正態(tài)分布,即,構(gòu)造T統(tǒng)計(jì)量,可得給定1?的置信水平下Y0的置信區(qū)間,中國居民人均收入消費(fèi)支出二元模型例中2001年人均GDP40331元,,于是人均居民消費(fèi)的預(yù)測(cè)值為?200112070221340331045151690817768(元),實(shí)測(cè)值(90年價(jià))17822元,相對(duì)誤差031,預(yù)測(cè)的置信區(qū)間,于是E?2001)的95的置信區(qū)間為,或(17418,18117),或(17111,18424),同樣,易得?2001的95的置信區(qū)間為,§35回歸模型的其他函數(shù)形式,一、模型的類型與變換二、非線性回歸實(shí)例,說明,在實(shí)際經(jīng)濟(jì)活動(dòng)中,經(jīng)濟(jì)變量的關(guān)系是復(fù)雜的,直接表現(xiàn)為線性關(guān)系的情況并不多見。如著名的恩格爾曲線ENGLECURVES表現(xiàn)為冪函數(shù)曲線形式、宏觀經(jīng)濟(jì)學(xué)中的菲利普斯曲線(PILLIPSCUVES)表現(xiàn)為雙曲線形式等。但是,大部分非線性關(guān)系又可以通過一些簡單的數(shù)學(xué)處理,使之化為數(shù)學(xué)上的線性關(guān)系,從而可以運(yùn)用線性回歸模型的理論方法。,一、模型的類型與變換,1、倒數(shù)模型、多項(xiàng)式模型與變量的直接置換法,例如,描述稅收與稅率關(guān)系的拉弗曲線拋物線SABRCR2CK。如果出現(xiàn)N2FN2,N1K1,則拒絕原假設(shè),認(rèn)為預(yù)測(cè)期發(fā)生了結(jié)構(gòu)變化。,例362中國城鎮(zhèn)居民食品人均消費(fèi)需求的鄒氏檢驗(yàn)。,1、參數(shù)穩(wěn)定性檢驗(yàn),19811994,RSS10003240,19952001,996714513181,19812001,148327263241117,給定?5,查表得臨界值F0054,13318,結(jié)論F值臨界值,拒絕參數(shù)穩(wěn)定的原假設(shè),表明中國城鎮(zhèn)居民食品人均消費(fèi)需求在1994年前后發(fā)生了顯著變化。,2、鄒氏預(yù)測(cè)檢驗(yàn),給定?5,查表得臨界值F0057,10318結(jié)論F值臨界值,拒絕參數(shù)穩(wěn)定的原假設(shè),四、非線性約束,也可對(duì)模型參數(shù)施加非線性約束,如對(duì)模型,施加非線性約束?1?21,得到受約束回歸模型,該模型必須采用非線性最小二乘法(NONLINEARLEASTSQUARES)進(jìn)行估計(jì)。非線性約束檢驗(yàn)是建立在最大似然原理基礎(chǔ)上的,有最大似然比檢驗(yàn)、沃爾德檢驗(yàn)與拉格朗日乘數(shù)檢驗(yàn),1、最大似然比檢驗(yàn)LIKELIHOODRATIOTEST,LR,估計(jì)無約束回歸模型與受約束回歸模型,方法最大似然法,檢驗(yàn)兩個(gè)似然函數(shù)的值的差異是否“足夠”大。,記L?,?2為一似然函數(shù)無約束回歸MAX,受約束回歸MAX,約束G?0,或求極值,G?以各約束條件為元素的列向量,?’以相應(yīng)拉格朗日乘數(shù)為元素的行向量,受約束的函數(shù)值不會(huì)超過無約束的函數(shù)值,但如果約束條件為真,則兩個(gè)函數(shù)值就非?!敖咏?。,由此,定義似然比(LIKELIHOODRATIO),如果比值很小,說明兩似然函數(shù)值差距較大,則應(yīng)拒絕約束條件為真的假設(shè);如果比值接近于1,說明兩似然函數(shù)值很接近,應(yīng)接受約束條件為真的假設(shè)。,具體檢驗(yàn)時(shí),由于大樣本下,H是約束條件的個(gè)數(shù)。因此通過LR統(tǒng)計(jì)量的?2分布特性來進(jìn)行判斷。,在中國城鎮(zhèn)居民人均食品消費(fèi)需求例中,對(duì)零階齊次性的檢驗(yàn),LR238573873032,給出?5、查得臨界值?20051=384,LR?20051,不拒絕原約束的假設(shè),結(jié)論中國城鎮(zhèn)居民對(duì)食品的人均消費(fèi)需求函數(shù)滿足零階齊次性條件。,2、沃爾德檢驗(yàn)(WALDTEST,W),沃爾德檢驗(yàn)中,只須估計(jì)無約束模型。如對(duì),在所有古典假設(shè)都成立的條件下,容易證明,因此,在?1?21的約束條件下,記,可建立沃爾德統(tǒng)計(jì)量,如果有H個(gè)約束條件,可得到H個(gè)統(tǒng)計(jì)量Z1,Z2,,ZH約束條件為真時(shí),可建立大樣本下的服從自由度為H的漸近?2分布統(tǒng)計(jì)量,其中,Z為以ZI為元素的列向量,C是Z的方差協(xié)方差矩陣。因此,W從總體上測(cè)量了無約束回歸不滿足約束條件的程度。對(duì)非線性約束,沃爾德統(tǒng)計(jì)量W的算法描述要復(fù)雜得多。,3、拉格朗日乘數(shù)檢驗(yàn),拉格朗日乘數(shù)檢驗(yàn)則只需估計(jì)受約束模型受約束回歸是求最大似然法的極值問題,?’是拉格朗日乘數(shù)行向量,衡量各約束條件對(duì)最大似然函數(shù)值的影響程度。,如果某一約束為真,則該約束條件對(duì)最大似然函數(shù)值的影響很小,于是,相應(yīng)的拉格朗日乘數(shù)的值應(yīng)接近于零。因此,拉格朗日乘數(shù)檢驗(yàn)就是檢驗(yàn)?zāi)承├窭嗜粘藬?shù)的值是否“足夠大”,如果“足夠大”,則拒絕約束條件為真的假設(shè)。,拉格朗日統(tǒng)計(jì)量LM本身是一個(gè)關(guān)于拉格朗日乘數(shù)的復(fù)雜的函數(shù),在各約束條件為真的情況下,服從一自由度恰為約束條件個(gè)數(shù)的漸近?2分布。,同樣地,如果為線性約束,LM服從一精確的?2分布,,N為樣本容量,R2為如下被稱為輔助回歸(AUXILIARYREGRESSION)的可決系數(shù),如果約束是非線性的,輔助回歸方程的估計(jì)比較復(fù)雜,但仍可按()式計(jì)算LM統(tǒng)計(jì)量的值。最后,一般地有LM≤LR≤W,
下載積分: 6 賞幣
上傳時(shí)間:2024-01-05
頁數(shù): 131
大?。?1.08(MB)
子文件數(shù):