
線性回歸分析PPT.ppt
26頁知知識點:回點:回歸分析分析Contents01???01???回回歸歸分析的起源分析的起源02???02???回回歸歸分析的概念分析的概念內(nèi)??容03???03???回回歸歸分析的分析的應(yīng)應(yīng)用用2a01-01回歸分析的起源?“ “回回歸歸” ”一一詞詞的由來的由來 英國著名生物學(xué)家、統(tǒng)計學(xué)家高爾頓(Francis Galton,1822~1911)3a01-01?????“回回歸”是是由由英英國國的的高高爾頓(生生物物學(xué)學(xué)家家達達爾文文的的表表弟弟)在在研研究究人人類遺傳問題時提提出出來來的的為了了研研究究父父代代與與子子代代身身高高的的關(guān)關(guān)系系,,高高爾頓搜搜集集了了1078對父父親及及其其兒兒子子的的身身高高數(shù)數(shù)據(jù)據(jù)高高爾頓對試驗數(shù)數(shù)據(jù)據(jù)進行行了了深深入入的的分分析析,,發(fā)現(xiàn)了了一一個個很很有有趣趣的的現(xiàn)象象—回回歸效效應(yīng):當(dāng)當(dāng)父父親高高于于平平均均身身高高時,,他他們的的兒兒子子身身高高比比他他更更高高的的概概率率要要小小于于比比他他更更矮矮的的概概率率;;父父親矮矮于于平平均均身身高高時,,他他們的的兒兒子子身身高高比比他他更更矮矮的的概概率率要要小小于于比比他他更更高高的的概概率率。
它它反反映映了了一一個個規(guī)律律,,即即這兩兩種種身身高高父父親的的兒兒子子的的身身高高,,有有向向他他們父父輩的的平平均均身身高高回回歸的的趨勢對于于這個個一一般般結(jié)論的的解解釋是是:大大自自然然具具有有一一種種約束束力力,,使使人人類身身高高的的分分布布相相對穩(wěn)定定而而不不產(chǎn)生生兩兩極分化,極分化,這就是所就是所謂的回的回歸效效應(yīng)4a01-02?概念概念回回歸分分析析法法:指將具有相關(guān)關(guān)系的兩個變量之間的數(shù)數(shù)量量關(guān)關(guān)系系進行測定,通過建立一個數(shù)學(xué)表達式進行統(tǒng)計估估計和和預(yù)測的統(tǒng)計研究方法自自變量量:一般把作為估測依據(jù)的變量叫做自變量因因變量量: 待估測的變量?回回歸方程:方程:反映自變量和因變量之間聯(lián)系的數(shù)學(xué)表達式回回歸模型模型:某一類回歸方程的總稱回歸分析的概念5a01-02?分分類類((1))回回歸分析按照涉及的分析按照涉及的變量多少,分量多少,分為 一元一元回回歸分析分析 多元多元回回歸分析分析((2))按照自按照自變量和因量和因變量之量之間的關(guān)系的關(guān)系類型,可分型,可分為 線性性回回歸分析分析 非非線性性回回歸分析分析回歸分析的概念6a01-02?步步驟驟 回歸分析的概念7a01-02?決定系數(shù)決定系數(shù)??????當(dāng)變量之間的關(guān)系可以用一個數(shù)學(xué)模型來模擬時,我們用決定系數(shù)(R2)判定數(shù)學(xué)模型擬合效果的好壞。
?????在數(shù)學(xué)上,決定系數(shù)?????????(y是實際值,y′是模擬值)??????決定系數(shù)決定系數(shù)R2越接近于越接近于1,,說明數(shù)學(xué)模型的模明數(shù)學(xué)模型的模擬效果越好效果越好??????回歸分析的概念8a01-03?利用利用ExcelExcel回回歸歸分析工具分析工具進進行回行回歸歸分析分析?一元一元線性回性回歸??????如果在回歸分析中只包括一個因變量和一個自變量,且二者的關(guān)系可用函數(shù)y=kx+b來模擬,這種回歸分析稱為一元線性回歸分析 y=kx+b y 因變量 x 自變量 k 回歸系數(shù),回歸直線的斜率 b 常數(shù)項,回歸直線在縱坐標(biāo)軸上的截距回歸分析的應(yīng)用9a01-03 案例分析:李明案例分析:李明應(yīng)該怎么做?(上)怎么做?(上)回歸分析的應(yīng)用例例1::李李明明想想開開一一家家社社區(qū)區(qū)超超市市,,前前期期去去了了很很多多小小區(qū)區(qū)做做實地地調(diào)查經(jīng)調(diào)研研得得到到小小區(qū)區(qū)超超市市的的年年銷售售額((百百萬萬元元))與與小小區(qū)區(qū)常常住住人人口口數(shù)數(shù)((萬萬人人))的的數(shù)數(shù)據(jù)據(jù)資料料如如表表所所示示,,請對超超市市的的年年銷售售額與與小小區(qū)區(qū)常常住住人人口口數(shù)數(shù)進行行回回歸分分析析,,幫幫助助李李明明進行行選址決策址決策。
10a01-03案例分析:案例分析:表:小區(qū)超市的年銷售額(百萬元)與小區(qū)常住人口數(shù)(萬人)統(tǒng)計表回歸分析的應(yīng)用11a01-03分析步分析步驟::( (一一) )回歸分析的應(yīng)用12a01-03 反映模型的擬合度合度分析步分析步驟:(二):(二)回歸分析的應(yīng)用13a01-03分析步分析步驟::(三)(三)?一元線性回歸???y=kx+b????第三組數(shù)據(jù)的第1個數(shù)據(jù)(301.665)是回歸直線的截截距距b,第2個數(shù)據(jù)(44.797)也叫回回歸系數(shù)系數(shù),其實就是回歸直線的斜率斜率k???回歸分析的應(yīng)用14a01-03?多元多元線性回性回歸??????如果在回歸分析中包括一個因變量和多個自變量,且因變量和自變量的關(guān)系可用函數(shù)y=k1x1+k2x2+…+knxn+b來模擬,這種回歸分析稱為多元線性回歸分析??????事實上,一種現(xiàn)象常常與多個因素相關(guān),所以,由多個自變量的最優(yōu)組合來估計和預(yù)測因變量,比只用一個自變量進行估計和預(yù)測更有效、更有實際意義回歸分析的應(yīng)用15a01-03案例分析:李明案例分析:李明應(yīng)該怎么做?(下)怎么做?(下)例例2::用用多多元元回回歸分分析析法法分分析析上上一一案案例例中中超超市市的的銷量量與與超超市市的的面面積大大小小、、促促銷費用用、、所所在在地地理理位位置置的的關(guān)關(guān)系系,,并并根根據(jù)據(jù)回回歸方方程程預(yù)測一一家家在在二二類地地段段、、面面積為1000平平方方米米、、月月促促銷費5萬元的超市月萬元的超市月銷售售額將會是多少。
將會是多少回歸分析的應(yīng)用16a01-03?多元多元線性回性回歸分析步分析步驟::回歸分析的應(yīng)用17a01-03?多元多元線性回性回歸分析步分析步驟::??回歸分析的應(yīng)用18a01-03利用利用ExcelExcel散點散點圖圖和和趨勢線進趨勢線進行回行回歸歸分析分析???“先插入散點圖,再添加趨勢線”的方法求趨勢線方程、相關(guān)系數(shù)和決定系數(shù),最后根據(jù)決定系數(shù)的大小判定模擬效果的好壞,并根據(jù)趨勢線方程做數(shù)據(jù)預(yù)測????例5:利用散點圖求上一案例中“超市年銷售額”和“小區(qū)人數(shù)”的回歸方程,“超市年銷售額”為因變量y,“小區(qū)人數(shù)”為自變量x??(1)插入散點插入散點圖??(2)添加添加趨勢線回歸分析的應(yīng)用19a01-03制作制作散點散點圖和和趨勢線進行回行回歸分析分析: :???回歸分析的應(yīng)用20a01-03 利用利用ExcelExcel散點散點圖和和趨勢線進行回行回歸分析分析::???回歸分析的應(yīng)用21a01-03 利用利用ExcelExcel散點散點圖和和趨勢線進行回行回歸分析分析::???回歸分析的應(yīng)用22a01-03 利用利用ExcelExcel散點散點圖和和趨勢線進行回行回歸分析分析::?????在現(xiàn)實生活中,很多社會經(jīng)濟現(xiàn)象是非線性發(fā)展的,此時數(shù)據(jù)點分布在一條曲線附近,例如指數(shù)曲線、拋物線等。
?????將例中的直線模型改成指數(shù)模型,操作如下回歸分析的應(yīng)用23a01-03想一想想一想 做一做:做一做:回歸分析的應(yīng)用已已知知2009—2015年年淘淘寶寶“雙雙11”當(dāng)當(dāng)天天銷量量統(tǒng)計如如圖所示,所示,請利用散利用散點點圖進行行回回歸分分析析,,模模擬淘淘寶寶“雙雙11”的的銷量量變化化規(guī)律律,,并并預(yù)測2016年的年的銷量24a01-03兩種回兩種回歸分析工具使用分析工具使用總結(jié)::?利用回歸分析工具進行線性回歸的優(yōu)缺點如下:①?優(yōu)點:可以進行一元線性回歸,也可以進行多元線性回歸②?缺點:只能進行線性回歸,不能直接進行非線性回歸?利用散點圖和趨勢線進行回歸分析的優(yōu)缺點如下:①?優(yōu)點:不僅能進行線性回歸,還能進行非線性回歸②?缺點:只能進行一元回歸,不能進行多元回歸回歸分析的應(yīng)用25aThank you!26a。
