資源簡介 9.2.2 總體百分位數的估計 第九章 統計 1.正確理解第p百分位數的概念,掌提求n個數據的第p百分位數的方法. 【回顧一】如何求一組數據的中位數? 先排序,數據個數為奇數個取中間值,偶數個取中間兩個的平均數; 【回顧二】中位數一定是給定這組數據中的一個數嗎? 不一定,比如給定數據個數為偶數個時,中位數就可能不在這組數據中。 【回顧三】一組數據中小于等于中位數的數據占比至少為多少?大于等于中位數的占比至少為多少? 均至少為50% 問題一:某市政府為了減少水資源的浪費,計劃對居民生活用水實施階梯水價制度,即確定一戶居民月用水量標準a,讓用水量不超過a的部分按平價4塊每噸收費,如果超出,超出a的部分按6塊每噸收費。現對100戶家庭進行了調查,數據如下,如果希望50%的家庭每月用水都能享受平價,如何確定a? 9.0 13.5 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0 2.2 8.6 13.9 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4 3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0 22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9 5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7 5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3 5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8 7.1 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6 28.0 第二步:計算中位數6.8噸,所以a值可確定為6.8噸。 解:第一步:排序 1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.6 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.7 6.9 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.5 13.6 13.8 13.9 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0 問題二:如果希望80%的家庭能享受平價,如何確定標準a? 1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.6 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.7 6.9 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.5 13.6 13.8 13.9 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0 提示:根據以上樣本數據,使全市居民用戶用水量中不超過a的占80%,大于a的占20%. 一般地,一組數據的第p百分位數是這樣一個值,它使得這組數據中至少___ 數據 這個值,且至少有 的數據 這個值,也可以稱作p%分位數。 第p百分位數 p% ≤ ( 100-p)% ≥ 思考:根據第p百分位數的定義和樣本數據,你能求出80%的家庭能享受平價的標準的a值嗎? 1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.6 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.7 6.9 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6 13.8 13.9 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0 100×80%=80 [13.6,13.8) 13.6+13.82=13.7 ? 這里的第80百分位數是否還可能是其他值? 問題3:由于登記員的失誤,第100個數據被抹掉了,你能不能只利用這99個數據求出80%的家庭能享受平價的標準的a值? 1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.6 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.7 6.9 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6 13.8 13.9 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0 99×80%=79.2 例1. 以下數據為參加數學競賽決賽的15人的成績:73,72,84,88,92,93,95,55,83,90,79,73,82,90,69, (1)試求這15人成績的第25百分位數; (2)求這15人成績的第60百分位數。 解:(1)第一步:排序:55,69,72,73,73,79,82,83,84,88,90,90,92,93,95; 第二步:15×25%=3.75; 第三步:第4位同學的成績,即73可以作為第25百分位數。 (2)第一步:排序:55,69,72,73,73,79,82,83,84,88,90,90,92,93,95; 第二步:15×60%=9; 第三步:取第9位和第10位同學的平均成績,即86分為這組數據第60百分位數。 思考1:結合第p百分位數定義和這兩道題目,如果要求一組數據的第p百分位數,可以分為幾類? 思考2:試總結求一組數據第p百分位數的方法和步驟。 1.幾個重要的百分位數 常用分位數:第25百分位數,第50百分位數,第75百分位數. 這三個分位數把一組由小到大排列后的數據分成四等份,因此稱為四分位數. 像第1百分位數,第5百分位數,第95百分位數,第99百分位數也常用. 25% 第一四分位數 (下四分位數) 50% 75% 中位數 第三四分位數 (上四分位數) 知識歸納 2.計算一組n個數據的第p百分位數的步驟: 第1步:按從小到大排列原始數據. 第2步:計算i=n×p%. 第3步:若i不是整數,而大于i的比鄰整數為j,則第p百分位數為第j項數據 若i是整數,則第p百分位數是第i項與第(i+1)項數據的平均數. 知識歸納 1.判斷正誤(正確的畫“√”,錯誤的畫“×”)(1)若一組樣本數據各不相等,則其75%分位數大于25%分位數. ( )(2)若一組樣本數據的10%分位數是23,則在這組數據中有10%的數據大于23. ( )(3)若一組樣本數據的24%分位數是24,則在這組數據中至少有76%的數據大于或等于24.( ) √ √ × 練一練: 例2 根據下列圖表,估計月均用水量的樣本數據的80%和95%分位數. 分析:有些情況下,我們只能獲得整理好的統計表或統計圖與原始數據相比,它們損失了一些信息。例如由上表中可以知道在[16.2,19.2)內有5個數據,但不知道這5個數據具體是多少.此時,我們通常把它們看成均勻地分布在此區間上. 解:由頻率分布表可知,月均用水量在13.2t以下的居民用戶所占比例為 在16.2t以下的居民用戶所占比例為 ∴80%分位數一定位于[13.2,16.2)內.由 可以估計月均用水量的樣本數據的80%分位數約為14.2 分組 頻數 頻率 [1.2,4.2) 23 0.23 [4.2,7.2) 32 0.32 [7.2,10.2) 13 0.13 [10.2,13.2) 9 0.09 [13.2,16.2) 9 0.09 [16.2,19.2) 5 0.05 [19.2,22.2) 3 0.03 [22.2,25.2) 4 0.04 [25.2,28.2] 2 0.02 合計 100 1.00 類似地,由 可以估計月均用水量的樣本數據的95%分位數約為22.95 試一試:根據下圖估計月均用水量的樣本數據的80%和95%分位數. 先算各組的頻率,解題步驟如下: 設80%分位數為m,則 0.77+(m-13.2)×0.030=0.80,解得 m=14.2. 設95%分位數為n,則 0.94+(n-22.2)×0.013=0.95,解得 n=22.97. 月平均用水量/t 0.12 0.1 0.08 0.06 0.04 0.02 0 1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2 0.107 0.043 0.030 0.030 0.017 0.010 0.013 0.007 0.077 頻率/組距 0.32 0.13 0.09 0.09 0.05 0.03 0.04 0.23 0.02 求總體百分位數的估計,首先要從小到大排列數據, 頻率直方圖看作數據均勻分布在直方圖上,然后計算出i=n×p%, 當i不是整數要取整,頻率直方圖要計算出比例值。 由頻率直方圖計算百分位數的規律: 知識歸納 1.數據7, 8.4, 8.4, 8.4, 8.6, 8.7, 9, 9.1的30%分位數為( ) A.8.4 B.8.5 C.8.6 D.8.3 √ 2.以下數據為參加數學競賽決賽的15人的成績(單位:分):78, 70,72,86,88,79,80,81,94,84,56,98,83,90,91,則這15人成績的第80百分位數是 A.90 B.90.5 C.91 D.91.5 √ 3.為了了解一片經濟林的生長情況,隨機抽測了其中60株樹木的底部周長(單位:cm),所得數據均在區間[80,130]上,其頻率分布直方圖如圖所示,你能估計一下60株樹木的第50百分位數嗎? 解:由題意知分別落在各區間上的頻數為 在(80,90)上有60×0.15=9,在(90,100)上有60×0.25=15, 在(100,110)上有60×0.3=18,在(110,120)上有60×0.2=12, 在[120,130]上有60×0.1=6. 由100+10×0.5?0.40.7?0.4 =100+103≈103.3, 從以上數據可知第50百分位數一定落在區間(100,110)上, 第75百分位數一定落在區間[110,120]上, 由110+10×0.75?0.70.9?0.7=110+104=112.5 綜上可知,第50百分位數和第75百分位數分別估計為103.3 cm,112.5cm. ? 1.本節課你學到了什么? 2.請你用自己的語言總結描述第p百分位數在一組數據中的地位。 3.由頻率分布直方圖百分位數的步驟是什么? 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫