
高等統(tǒng)計學(xué)-New答案.doc
100頁中國人民大學(xué)接收同等學(xué)歷人員申請碩士學(xué)位考試試題 招生專業(yè): 統(tǒng)計學(xué) 考試科目: 高等統(tǒng)計學(xué)(數(shù)理統(tǒng)計學(xué)) 課程代碼:123101 考題卷號 : 1一、多項選擇題(每題4分,一共20分,每題要求:選擇正確答案,對選擇或未選答案進行簡要而清晰的原因解釋將答案填寫在答題紙上,填寫在試題上無效得分規(guī)則:選對并對答案解釋合理,得4分;沒有對未選答案解釋最多得2分;漏選得1分,選錯可參考解釋酌情給分;不選得0分)1. 有關(guān)樣本的分布,以下陳述正確的是:ABCA. 如果樣本X1,…,Xn獨立同分布來自Gamma分布,在大樣本下有近似的正態(tài)分布;B.如果樣本X1,…,Xn獨立同分布來自N(),在大樣本情況下有精確分布N();C.如果樣本X1,…,Xn獨立同分布來自N(),即使樣本量不大,也服從正態(tài)分布;D.如果樣本X1,…,Xn來自任意分布,在大樣本情況下,由X1,…,Xn組成的數(shù)據(jù)有近似的正態(tài)分布; 2.有關(guān)檢驗的p值,下面說法正確的是:BC A. 一般為[0,0.1]之間的一個很小的概率; B. 接受備擇假設(shè)的最小顯著性水平;C. 如果p值小于顯著性水平,則拒絕零假設(shè); D. 樣本統(tǒng)計量的分布函數(shù)。
3. 請問以下哪些方法可以用來判斷數(shù)據(jù)可能背離正態(tài)分布:BA. Q-Q圖上,如果數(shù)據(jù)和基線之間幾乎吻合;(基線指的是什么???)B. Kolmogrov-Smirnov正態(tài)檢驗中的統(tǒng)計量所對應(yīng)的p值小于0.05;C.對數(shù)據(jù)直方圖做光滑后沒有發(fā)現(xiàn)數(shù)據(jù)有很大的發(fā)散趨勢;D.擬合優(yōu)度檢驗,統(tǒng)計量的值偏小4.若抽樣誤差為5,總體標(biāo)準(zhǔn)差為40,如果樣本量足夠大,正態(tài)分布的0.975分位數(shù)近似為2,要估計總體均值的95%的置信區(qū)間所需要的樣本量大概為:BA 156;B 256;C 356 ; d) 456.5.關(guān)于假設(shè)檢驗,給定一組獨立同分布的隨機樣本,給定顯著性水平,如下理解正確的是:D A.單邊檢驗拒絕,雙邊檢驗一定拒絕;B.雙邊檢驗接受,一定有一個單邊檢驗是拒絕的;C.單邊檢驗拒絕,雙邊檢驗一定拒絕D.雙邊檢驗拒絕,一定有一個單邊檢驗是拒絕的;二、簡答題:(10分×3=30分)1. 假設(shè)檢驗的零假設(shè)和備擇假設(shè)的設(shè)立對于檢驗的結(jié)論影響不大,請問這樣的理解有問題嗎?請給出你的解釋解:對同一樣本信息,由于零假設(shè)的不同選擇,可能會得到不同的結(jié)論由于顯著性檢驗只控制第一類錯誤的概率,而不考慮犯第二類錯誤的概率,因而尋找拒絕域的時候只涉及到原假設(shè),不涉及備擇假設(shè)。
于是零假設(shè)的確定在假設(shè)檢驗中非常重要事實上,假設(shè)檢驗所依據(jù)的小概率事件在一次實驗中幾乎不可能發(fā)生的原理小概率事件在一次試驗中發(fā)生與小概率事件原理相‘矛盾’并非形式邏輯的絕對矛盾如果統(tǒng)計量落入拒絕域,也就是小概率事件居然在一次實驗中居然發(fā)生了,根據(jù)小概事件原理,說明零假設(shè)顯著不成立,應(yīng)該否定原假設(shè)如果統(tǒng)計量落入接收域,并不能肯定原假設(shè)的正確性,只能說明觀測結(jié)果與零假設(shè)不矛盾,沒有足夠理由拒絕零假設(shè)此時假設(shè)檢驗并不能檢驗出零假設(shè)的正確性2. 解釋下面符號的區(qū)別: , 和(提示:請按有放回和無放回抽樣分別敘述)解:分別是樣本方差,總體方差與樣本均值的方差一般來說,從總體中抽樣的方式不同,會影響到樣本均值的方差樣本的抽取方式為有放回的情況下,獲得的樣本為簡單隨機樣本,即從總體中抽出的樣本為相互獨立并且與總體同分布從總體中抽出容量為n 的樣本,并且與總體同分布,從而樣本均值的方差當(dāng)抽樣方式為無放回的情況時,下一次抽樣是受前一次抽樣的結(jié)果的影響的此時,設(shè)總體中包含 N個個體,從總體中抽取容量為n 的樣本,=當(dāng)總體N充分大的時候,接近于放回抽樣的均值方差3.統(tǒng)計推斷與描述統(tǒng)計之間有哪些重要的區(qū)別?描述統(tǒng)計是指統(tǒng)計數(shù)據(jù)的搜集、整理、顯示和分析等,統(tǒng)計推斷是利用樣本信息和概率論對總體的數(shù)量特征進行估計和檢驗等。
三、計算題(25分)1.Hardy-Weinberg平衡問題中,父代有兩種基因M和N,M在種群中的分布為b(1,p)現(xiàn)在測量到了子代基因分布為:MMNN總量頻數(shù)3425001871029a) 請根據(jù)這些數(shù)據(jù)求父代的p的極大似然估計;(10分)b) 請給出p的置信區(qū)間的求解公式,并解釋; (15分)解:a)設(shè)父代樣本X服從b(1,p),,最大似然估計為:由于Hardy-Weinberg平衡,群體的基因頻率在一代一代繁殖傳代中保持不變從而子代的基因型頻率分別為,從而,.b)當(dāng)樣本數(shù)n足夠多時父代基因M的頻率近似服從正態(tài)分布,,從而從而參數(shù)p的置信區(qū)間為四、論述題:(25分)研究者想了解某種電子設(shè)備產(chǎn)品在一年的各個季節(jié)里被購買的情況是否存在不同如果用銷售量來解釋這一問題,對這一問題可能提出的最簡單的零假設(shè)可能是什么?在這一假設(shè)之下,研究者調(diào)查了有關(guān)這種產(chǎn)品過去3年的銷售量2070萬臺表1 某種電子設(shè)備產(chǎn)品在過去3年中的銷售量季節(jié)O(萬)EOi-Ei(Oi-Ei)2春季 495夏季 503秋季 491冬季581總計 20701.解釋表頭字母的含義;2.請將上面的表格填寫完整2.如果,請給出你的推斷過程和據(jù)此可能的結(jié)論。
解:1.這一問題可能提出的最簡單的零假設(shè)可能是H0:各個季節(jié)里被購買的情況是相同O表示各個季度觀察次數(shù),E表示各個季度的理論次數(shù),表示卡方統(tǒng)計量2.季節(jié)O(萬)EOi-Ei(Oi-Ei)2春季 495517.5-22.5506.250.98夏季 503517.514.5210.250.41秋季 491517.5-26.5702.251.36冬季581517.563.54032.257.79總計 2070207010.543.由于,拒絕原假設(shè),認(rèn)為各個季節(jié)里被購買的情況是顯著差異的中國人民大學(xué)接收同等學(xué)歷人員申請碩士學(xué)位考試試題 招生專業(yè): 統(tǒng)計學(xué) 考試科目: 高等統(tǒng)計學(xué)(數(shù)理統(tǒng)計學(xué)) 課程代碼:123101 考題卷號 : 2一、多項選擇題(每題4分,一共20分,每題要求:選擇正確答案,對選擇或未選答案進行簡要而清晰的原因解釋將答案填寫在答題紙上,填寫在試題上無效得分規(guī)則:選對并對答案解釋合理,得4分;沒有對未選答案解釋最多得2分;漏選得1分,選錯可參考解釋酌情給分;不選得0分)1.關(guān)于假設(shè)檢驗,給定一組獨立同分布的隨機樣本,給定顯著性水平,如下理解正確的是:D A.單邊檢驗拒絕,雙邊檢驗一定拒絕;B.雙邊檢驗接受,一定有一個單邊檢驗是拒絕的;C.單邊檢驗拒絕,雙邊檢驗一定拒絕。
D.雙邊檢驗拒絕,一定有一個單邊檢驗是拒絕的; 2.某汽車生產(chǎn)廠家為增加某型號汽車的銷售量,采用促銷手段,促銷一個月后,分別收集了8個銷售點處促銷前一個月和促銷后一個月該車型的銷售輛,如果不考慮其他影響銷售量因素,僅通過觀察和分析這些樣本數(shù)據(jù),是否認(rèn)為這次促銷有助于提高汽車的銷售量請將合適的可用于分析該類問題的檢驗過程選出來:C銷售點代號: 1 2 3 4 5 6 7 8促銷前(輛): 90 83 105 97 110 78 55 123 促銷后(輛): 97 80 110 93 123 84 57 110 A. 兩樣本Z檢驗B. 兩樣本t檢驗C. 單一樣本t檢驗D. 單一樣本Z檢驗 3.在參數(shù)估計中,要求通過樣本的統(tǒng)計量來估計總體參數(shù),評價統(tǒng)計量的標(biāo)準(zhǔn)之一是該統(tǒng)計量隨著樣本量的增大,它與它估計的總體參數(shù)越來越近,這種評價標(biāo)準(zhǔn)稱為:C A.無偏性 B.有效性 C.一致性 D.充分性4. 請問以下哪些方法可以用來判斷數(shù)據(jù)可能背離正態(tài)分布:BA. Q-Q圖上,如果數(shù)據(jù)和基線之間幾乎吻合;B. Kolmogrov-Smirnov正態(tài)檢驗中的統(tǒng)計量所對應(yīng)的p值=0.001;C.對數(shù)據(jù)直方圖做了光滑后沒有發(fā)現(xiàn)數(shù)據(jù)有很大的發(fā)散趨勢;D.擬合優(yōu)度檢驗,統(tǒng)計量的值偏小。
5.研究人員對有糖尿病的老鼠和正常老鼠血液中某種礦物質(zhì)的含量進行研究,經(jīng)驗表明有糖尿病的老鼠和正常老鼠血液中某種礦物質(zhì)的含量測量方差相等,測得如下試驗數(shù)據(jù):糖尿病老鼠:9只,樣本均值64.26,樣本方差1.40正常老鼠: 7只,樣本均值75.66,樣本方差1.32在置信水平為0.10之下,有糖尿病的老鼠和正常老鼠血液中Fe的含量之差的置信區(qū)間為(t(0.95,14)=1.76):([-12.43,-10.36])A. [5.68,15.56]B. [8.02,19.47]C.[10.36,12.43]D.[6.53,16.32]5. 置信水平為α,下列說法正確的是( BD ),A 在置信水平一定的條件下,提高置信估計精度需要縮小樣本量;B 在置信水平一定的條件下,提高置信估計精度需要增加樣本量;C 在樣本量一定的條件下,提高置信估計精度,需要降低置信水平;D 在樣本量一定的條件下,提高置信估計精度,需要增大置信水平二、簡答題:(10分×3=30分)1.解釋p值檢驗的基本原理 p值是在原假設(shè)下出現(xiàn)檢驗統(tǒng)計量的實現(xiàn)值及(向備擇假設(shè)方向)更極端的值的概率 p-值度量從樣本數(shù)據(jù)得到的信息對原假設(shè)的支持程度。
p-值越小,就越有理由說明樣 本數(shù)據(jù)不支持原假設(shè)如果p-值小于顯著性水平,那么能夠拒絕原假設(shè),否則就不能拒絕因此p-值常常被稱為該檢驗的觀測顯著性水平2.解釋下面符號的區(qū)別: , 和(提示:請按有放回和無放回抽樣分別敘述)解:分別是樣本方差,總體方差與樣本均值的方差一般來說,從總體中抽樣的方式不同,會影響到樣本均值的方差樣本的抽取方式為有放回的情況下,獲得的樣本為簡單隨機樣本,即從總體中抽出的樣本為相互獨立并且與總體同分布從總體中抽出容量為n 的樣本,并且與總體同分布,從而,樣本均值的方差=當(dāng)抽樣方式為無放回的情況時,下一次抽樣是受前一次抽樣的結(jié)果的影響的此時,設(shè)總體中包含 N個個體,從總體中抽取容量為n 的樣本,=當(dāng)總體N充分大的時候,接近于放回抽樣的均值方差3.請說明Gamma分布與卡方分布之間有哪些區(qū)別與聯(lián)系?自由度為n的卡方分布是Gamma分布Gamma(n/2,1/2)的特例.三、計算題(20分)用possion()分布參數(shù)的極大似然估計的漸進分布求置信區(qū)間最大似然估計為:.當(dāng)n充分大時,漸進正態(tài)N(,), ,從而從而參數(shù)的置信區(qū)間為四、論述題:(30分)研究者想了解某地區(qū)的醫(yī)院出院人數(shù)(DISC)和床位量(BEDN),調(diào)查了21家醫(yī)院數(shù)據(jù),分為甲級(I)和乙級(II)兩類如下:等級IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII。
