資源簡介 9.2.4 總體離散程度的估計 第九章 統計 1.理解方差、標準差的含義,會計算方差和標準差. 2.掌握求分層隨機抽樣總樣本的平均數及方差的方法. 有兩位射擊運動員在一次射擊測試中各射靶10次,每次命中的環數如下: 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 如果你是教練,你如何對兩位運動員的射擊情況做出評價? 如果這是一次選拔性考核,你應當如何作出選擇? 4 4 5 7 7 7 8 9 9 10 5 6 6 7 7 7 7 8 8 9 從數據看,甲、乙射擊成績的平均數、眾數、中位數均為7. 從統計圖看,甲的成績比較分散,波動較大; 乙的成績比較集中,比較穩定. 無差異 有差異 如何度量? 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 4 4 5 7 7 7 8 9 9 10 5 6 6 7 7 7 7 8 8 9 一種簡單的度量數據離散程度的方法就是用極差. 甲命中環數的極差=10-4=6,乙命中環數的極差=9-5=4. 可以發現甲的成績波動范圍比乙的大. 極差在一定程度上刻畫了數據的離散程度.但因為極差只使用了數據中最大、最小兩個值的信息,對其他數據的取值情況沒有涉及,所以極差所含的信息量很少. 如果射擊成績很穩定,那么大多數的射擊成績離平均成績不會太遠; 如果射擊的成績波動幅度很大,那么大多數的射擊成績離平均成績會比較遠. 因此,我們可以通過這兩組射擊成績與它們的平均成績的“平均距離”來度量 成績的波動幅度. ? 如何定義? 給“平均距離”下定義 為了避免式子中出現絕對值,改用平方代替 設一組數據是x1, x2, …, xn, 則這組數據的方差為 知識點1:方差和標準差的定義 則這組數據的方差為 ①為了計算方便,還可把方差寫成 設一組數據是x1, x2, …, xn, 由于方差的單位是原始數據的單位的平方,與原始數據不一致.為了使二者單位一致,我們對方差開平方。 注:s≥0;s=0時表示這組數據的每個數據都是相等的. ②這組數據的標準差為 嘗試歸納計算方差的基本步驟 ①計算平均值; ②計算每個數據與平均值的差的平方; ③將所有平方相加; ④將上述平方和除以數據個數(樣本容量). 現在你能解決這個問題嗎? 有兩位射擊運動員在一次射擊測試中各射靶10次,每次命中的環數如下: 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 如果你是教練,你如何對兩位運動員的射擊情況做出評價? 如果這是一次選拔性考核,你應當如何作出選擇? 可根據標準差來判斷兩名運動員的成績的離散程度, 計算可得????甲=????,????乙≈????.????????????. 由????甲>????乙可知,____的成績離散程度大. 由此可以估計,____比____的射擊成績穩定. 如果要從這兩名選手中選擇一名參加比賽,要看他們的平均成績在所有參賽選手中的位置.如果兩人都排在前面,就選______________選手; 如果兩人都排在后面,就選____選手. ? 甲 甲 乙 成績穩定的乙 甲 知識點2:樣本和總體的方差和標準差 若總體中所有個體的變量值分別為????????,????????,…,????????,總體平均數為????, 則稱????????=????????????=????????(?????????????)????為總體方差,????=????????為總體標準差. ? 標準差刻畫了數據的離散程度或波動幅度: 標準差越大,數據的離散程度越大;標準差越小,數據的離散程度越小. 思想:用樣本標準差估計總體標準差 總體方差的加權形式:若總體的N個變量值中,不同的值共有k(k≤N)個, 不妨記為????????,????????,...,????????,其中Y;出現的頻數為f;(i= 1,2,...k), 則總體方差為 ? 若一個樣本中個體的變量值分別為????????,????????, ...,????????,樣本平均數為y, 則稱 為樣本方差,????=????????為樣本標準差. ? 鞏固1:方差和標準差的計算 [練習1]某同學近5次考試的數學附加題的得分分別為30,26,32,27,35,則這組數據的方差為 . [練習2]隨機調查某校50個學生的午餐費,結果如下表, 這50個學生午餐費的平均值和方差分別是( ) {5940675A-B579-460E-94D1-54222C63F5DA}餐費(元) 3 4 5 人數 10 20 20 練一練 鞏固2:方差和標準差的意義 [練習3]樣本數均為9的四組數據,它們的平均數都是5,條形圖如圖所示,則標準差最大的一組是( ) A.第一組 B.第二組 C.第三組 D.第四組 D 追問1:比較4組方差的大小關系 練一練 鞏固3:方差和標準差的性質 [練習4]已知數據x1,x2,x3,…,xn是上海普通職工n個人的年收入(n≥3,n∈N*), 設這n個數據的中位數為x,平均數為y,方差為z,如果再加上馬云的年收入 xn+1,則這n+1個數據中,下列說法正確的是( ) A.平均數大大增大,中位數一定變大,方差可能不變 B.平均數大大增大,中位數可能不變,方差變大 C.平均數大大增大,中位數可能不變,方差也不變 B 練一練 追問1:數據x1,x2,x3,…,xn平均數為????,方差為???????? 則數據x1+1,x2+1,x3+1,…,xn+1,平均數為? 方差為? ? 則數據2x1,2x2,2x3,…,2xn,平均數為? 方差為? 則數據2x1+1,2x2+1,2x3+1,…,2xn+1,平均數為? 方差為? 知識點3:平均數、方差、標準差的性質 [引例1]若樣本數據x1,x2,…,x10的平均數為8,則2x1-1,2x2-1,…,2x10-1 的平均數為( ) A.8 B.15 C.16 D.32 B {5940675A-B579-460E-94D1-54222C63F5DA}數據 平均數 標準差 方差 x1,…,xn s s2 ax1+b,…,axn+b |a|s a2s2 回顧:分層隨機抽樣的總樣本平均數、總體平均數 如:調查高一級712名(男326/女386)同學的平均身高,抽50名同學作為樣本 (法一) (法二) 例6.在對樹人中學高一年級學生身高的調查中,采用樣本量比例分配的分層隨機抽樣,如果不知道樣本數據,只知道抽取了男生23人,其平均數和方差分別為170.6和12.59,抽取了女生27人,其平均數和方差分別為160.6和38.62. 你能由這些數據計算出總樣本的方差,并對高一年級全體學生的身高方差做出估計嗎? 解:把男生樣本記為????????,????????,... , ????????????,其平均數記為????,方差記為????????????; 把女生樣本記為????????,????????,... , ????????????, 其平均數記為????,方差記為????????????; 把總樣本數據的平均數記為????,方差記為????????. ? 例6.在對樹人中學高一年級學生身高的調查中,采用樣本量比例分配的分層隨機抽樣,如果不知道樣本數據,只知道抽取了男生23人,其平均數和方差分別為170.6和12.59,抽取了女生27人,其平均數和方差分別為160.6和38.62. 你能由這些數據計算出總樣本的方差,并對高一年級全體學生的身高方差做出估計嗎? 代入數據得總樣本方差為51.4862 總樣本的平均數: 知識點4:分層隨機抽樣的方差和標準差 分層隨機抽樣的方差計算: 設樣本容量為????,平均數為????,其中兩層的個體數量分別為????????,????????, 兩層的平均數分別為????????,????????,方差分別為????????????,????????????, 則這個樣本的方差為:????????=????????????[????????????+(?????????????)????]+????????????[????????????+(?????????????)????]. ? 計算分層隨機抽樣的方差????????的步驟 (1)確定各層的樣本均值和樣本方差: ????????,????????,????????????, ????????????; (2)確定總樣本均值????; (3)應用公式???????? ="[???????????? + ?????????????????] +????????????[???????????? +?????????????????]計算????????. ? 知識點5:樣本和總體的方差和標準差 例如,根據9.2.1節中100戶居民用戶的月均用水量數據, 可以計算出樣本平均數????=????.????????,樣本標準差????=????.????????. ? 以樣本點為中心,兩倍標準差的范圍 樣本標準差刻畫了樣本數據離平均數波動的幅度大小,平均數和標準差一起能反映數據取值的信息. 這100個數據中大部分落在區間[????-s,????+s]= [2.59,14.99]內, 在區間[????-2s,????+ 2s] = [-3.16,21.19]外的 只有7個. . 絕大多數數據落在[????-2s,???? + 2s]內. ? [練習5]一個小商店從一家有限公司購進21袋白糖,每袋白糖的標準質量是500g,為了了解這些白糖的質量情況,稱出各袋白糖的質量(單位:g)如下:486 495 496 498 499 493 493498 484 497 504 489 495 503499 503 509 498 487 500 508 (1)21袋白糖的平均質量是多少?標準差s是多少? (2)質量位于????-s與????+s之間有多少袋白糖?所占的百分比是多少? ? (2)質量位于????-s與????+s之間,即重量在 ? 解:(1) 練一練 [練習6]某學校有高中學生500人,其中男生320人,女生180人.有人為了獲得該校全體高中學生的身高信息,采用分層抽樣的方法抽取樣本,并觀測樣本的指標值(單位:cm),計算得男生樣本的均值為173.5,方差為17,女生樣本的均值為163.83,方差為30.03. (1)根據以上信息,能夠計算出總樣本的均值和方差嗎?為什么? (2)如果已知男、女樣本量按比例分配,你能計算出總樣本的均值和方差各為多少嗎? (3)如果已知男、女的樣本量都是25,你能計算出總樣本的均值和方差各為多少嗎?它們分別作為總體均值和方差的估計合適嗎?為什么? 練一練 (1)不能,因為男生女生的樣本量不知; 都不合適,男女生身高差異很大, 這個樣本的分布和總體分布可能相差比較大. ????????=????????????[????????????+(?????????????)????]+????????????[????????????+(?????????????)????] ? 分層隨機抽樣的方差: 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫