資源簡介 9.2.3 總體集中趨勢的估計 第九章 統計 1.通過具體實例進一步了解平均數、中位數、眾數的意義及特征,并能選取合適的量來刻畫數據的集中趨勢. 2.能正確提取數據的集中趨勢,會用樣本的集中趨勢估計總體的集中趨勢. “希望中學”在每年期末都會對全體高一學生進行“年閱讀量”的調查,在某次調查中發現某組10名同學的“課外書閱讀量”數據如下(單位:本): 65, 68, 69,72, 72, 75, 76, 78, 80,95 學生A:"他們的閱讀量平均分好高啊,真厲害!" 學生B:"我感覺前3個數據不是很高,為什么平均閱讀量還能到75?" 思考:如果去掉一個最高分95和一個最低分65,再算平均數會怎樣? 中位數和眾數又有什么變化?" 回顧:平均數、中位數、眾數是什么? 中位數:一組數據按大小順序依次排序后, 當數據個數是奇數時,處在最中間的數是中位數; 當數據個數是偶數時,最中間兩個數的平均數是中位數. 平均數: 眾數:一組數據中出現次數最多的數. 問題.根據100戶居民用戶的月均用水量的調查數據, 計算樣本數據的平均數和中位數, 并據此估計全市居民用戶月均用水量的平均數和中位數. 9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0 2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.4 22.4 3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0 22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9 5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7 5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3 5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8 7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6 解:① 根據已知100戶居民用戶月均用水量的數據,可得樣本平均數為 即100戶居民的月均用水量的平均數為8. 79 t. 由上述數據可得,第50個數和第51個數均為6.8,由中位數的定義,可得100戶居民的月均用水量的中位數是6.8 t. ②將樣本數據按從小到大排序,結果如下: 1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.4 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8 6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6 13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0 因為數據是抽自全市居民戶的簡單隨機樣本,所以我們可以據此估計全市居民用戶的月均用水量約為8.79 t,其中位數約為6.8 t. 小明用統計軟件計算了100戶居民用水量的平均數和中位數. 但錄入數據時把一個數據7.7錄成了77. 請計算錄入數據的平均數和中位數,并與真實的樣本平均數和中位數作比較. 哪個量改變了?你能解釋其中的原因嗎? 由計算得, 平均數由原來的8.79t變為9.483t, 中位數沒有變化, 還是6.8t. 樣本平均數與每一個樣本數據有關,樣本中的任何一個數據的改變都會引起平均數的改變; 中位數只利用了樣本數據中間位置的一個或兩個值,所以不是任何一個樣本數據的改變都會引起中位數的改變 與中位數比較,平均數反映出樣本數據中的更多信息,對樣本中的極端值更加敏感. 探究:平均數與中位數都描述了數據的集中趨勢,而且平均數比中位數對樣本中的極端值更加敏感,你是否能利用這個特征,判斷下圖的三種分布形態中,平均數和中位數的大小關系? 平均數與中位數有怎樣的區別與聯系 9 個 4 7 個 5 對于一個單峰的頻率分布直方圖來說,如果直方圖的形狀是對稱的,平均數與中位數大小關系如何? 7 個 3 平均數與中位數大致相同 直方圖在右邊“拖尾”,平均數( )中位數 9 個 4 2個 6 4 個 5 1個 7 7 個 3 直方圖在左邊“拖尾”,平均數( )中位數 平均數與中位數的區別與聯系 (1)直方圖的形狀是對稱的,平均數和中位數應該大體上差不多 和中位數相比,平均數總是在“長尾巴”那邊. (2)直方圖在右邊“拖尾”,平均數大于中位數 (3)直方圖在左邊“拖尾”,那么平均數小于中位數 歸納總結 【例1】小王到一家公司參加應聘,公司的經理告訴他說:“我們公司的收入水平很高,去年,在50名員工中,最高年收入者達到了110萬元,他們年收入的平均數是3.8萬元.”小王希望 獲得年薪2.5萬元. (1) 你是否能判斷小王可以成為此公司的一名高收入者? (2)如果經理繼續告訴小王“員工年收入的變化范圍是0.5萬到100萬”這個信息是否足以使小王作出是否受聘的決定? (3)如果經理繼續給小王提供如下信息,員工年收入的中間60%(即去掉最少的20%和最多的20%后所剩下的)變化范圍是1萬到3萬.小王應如何使用這條信息作出是否受聘的決定? 解:(1)不能,因為平均年收入和最高年收入差別太大,說明高收入的職工只占極少數,現在已經知道至少有一個人的年收入為110萬元,則其他員工的年收入和為3.8×50-100=80(萬元). 每人年收入平均只有1.63萬元,如果再有幾個年收入特別高的,那么初進公司的員工年收入會很低. (2)不能,要看中位數是多少. (3)可以確定80%的員工的年收入在1萬元以上,20%的員工年收入在3萬元以上. 員工年收入的中位數大約在2萬元,因為有年收入110萬這個極端值的影響,使得平均年收入比中位數高許多. 這個例子更關注的是數據的位次是中上還是中下,選用中位數來刻畫數據的集中程度 √ 1.上海市實驗學校藝術節舉行彈鋼琴比賽,現有21位選手報名參賽,初賽成績各不相同,取前10名參加決賽,小明同學已經知道了自己的成績,為了判斷自己是否能進入決賽,他還需要知道21名同學成績的( ) A.平均數 B.中位數 C.眾數 D.方差 例2:某學校要定制高一年級的校服,學生根據廠家提供的參考身高選擇校服規格,據統計,高一年級女生需要不同規格校服的頻數如表所示。 {5C22544A-7EE6-4342-B048-85BDC9FD1C3A}校服規格 155 160 165 170 175 合計 頻數 39 64 167 90 26 386 如果用一個量來代表該校高一年級女生所需校服的規格,那么在中位數、平均數和眾數中哪個量比較合適?試討論用表中的數據估計全國高一年級女生校服規格的合理性。 {5C22544A-7EE6-4342-B048-85BDC9FD1C3A}校服規格 155 160 165 170 175 合計 頻數 39 64 167 90 26 386 用眾數165作為該校高一年級女生校服的規格比較合適. 由于全國各地的高一年級女生身高存在一定的差異,所以用一個學校的數據估計全國高一年級女生的校服規格不合理. 2.某鞋店試銷一種新女鞋,銷售情況如下表: 鞋號 34 35 36 37 38 39 40 41 日銷量/雙 2 5 9 16 9 5 3 2 如果你是鞋店經理,那么下列統計量中對你來說最重要的是 A.平均數 B.眾數 C.中位數 D.極差 √ 剛才通過幾個具體例子我們體會到平均數,中位數,眾數都是刻畫數據集中趨勢的量,但是它們刻畫的角度不同,有何不同? 在具體的問題中我們如何選取那個量刻畫數據的集中趨勢? 思考與討論 1.平均數、中位數和眾數等都是刻畫 的量,它們從不同角度刻畫了一組數據的集中趨勢. 平均數反映數據在大小上的中心,中位數反映了數據在位置上的中心,眾數反應數據在數量上的中心 2.一般地,對數值型數據(如用水量、身高、收入、產量等)集中趨勢的描述,可以用 、 ;而對分類型數據(如校服規格、性別、產品質量等級等)集中趨勢的描述,可以用 . “中心位置” 平均數 中位數 眾數 知識總結 3.眾數、中位數、平均數的比較 {5C22544A-7EE6-4342-B048-85BDC9FD1C3A}名稱 優點 缺點 平均數 與中位數相比,平均數反映出樣本數據中更多的信息,對樣本中的極端值更加敏感 任何一個數據的改變都會引起平均數的改變.數據越“離群”,對平均數的影響越大 中位數 不受少數幾個極端數據(即排序靠前或靠后的數據)的影響 對極端值不敏感 眾數 體現了樣本數據的最大集中點 眾數只能傳遞數據中的信息的很少一部分,對極端值不敏感 知識總結 樣本的平均數、中位數和眾數可以分別作為總體的平均數、中位數和眾數的估計,但在某些情況下我們無法獲知原始的樣本數據. 例如,我們在報紙、網絡上獲得的往往是已經整理好的統計表或統計圖. 這時該如何估計樣本的平均數、中位數和眾數? 問題2:你能以下面的頻率分布直方圖提供的信息為例,給出估計方法嗎? 在頻率分布直方圖中,我們無法知道每個組內的數據是如何分布的.此時,通常假設它們在組內均勻分布. 根據頻率分布直方圖 如何計算樣本平均數? 思考 1. 根據頻率分布直方圖計算樣本平均數: 因為樣本平均數可以表示為數據與它的頻率的乘積之和. 所以在頻率分布直方圖中,樣本平均數可以用每個小矩形底邊中點的橫坐標與小矩形的面積的乘積之和近似代替. 所以由上圖可得樣本平均數為 這個結果與根據原始數據計算的樣本平均數8.79相差不大. 由于0.077×3=0.231,(0.077+0.107)×3=0.552, 因此中位數落在區間[4.2, 7.2)內. 設中位數為x,由0.077×3+0.107×(x-4.2)=0.5,解得x≈6.71. 因此,中位數約為6.71. 2. 根據頻率分布直方圖計算樣本中位數: 在頻率分布直方圖中,中位數左邊 和右邊的直方圖的面積應該相等. 這個結果與根據原始數據計算的樣本中位數6.8相差不大. 3. 根據頻率分布直方圖計算樣本眾數: 在頻率分布直方圖中,我們常常把最高 直方圖底邊的中點作為眾數的估計值. 在這個實際問題中,眾數“5. 7”讓我們知道月均用水量在區間[4.2, 7.2)內的居民用戶最多. 在此頻率分布直方圖中,月均用水量在區間[4.2, 7.2)內的居民最多,所以將這個區間的中點5.7作為眾數的估計值. 眾數: 最高矩形的中點的橫坐標 中位數:中位數左邊的直方圖面積和右邊的直方圖面積相等 平均數:每個小矩形底邊中點的橫坐標與小矩形的面積的乘積之和 如何由頻率分布直方圖估計眾數、中位數、平均數? 思考與討論 3.某校從參加高二年級學業水平測試的學生中抽出80名學生,其數學成績(均為整數)的頻率分布直方圖如圖所示. (1)求這次測試數學成績的眾數; (2)求這次測試數學成績的中位數. 解:(1)由頻率分布直方圖知眾數為70+802=75. (2)設中位數為x,由于前三個矩形面積 之和為0.4,第四個矩形面積為0.3, 0.3+0.4>0.5,因此中位數位于第四個矩形內, 得0.1=0.03(x-70),解得x≈73.3. ? 1.眾數、中位數、平均數的比較 {5C22544A-7EE6-4342-B048-85BDC9FD1C3A}名稱 優點 缺點 平均數 與中位數相比,平均數反映出樣本數據中更多的信息,對樣本中的極端值更加敏感 任何一個數據的改變都會引起平均數的改變.數據越“離群”,對平均數的影響越大 中位數 不受少數幾個極端數據(即排序靠前或靠后的數據)的影響 對極端值不敏感 眾數 體現了樣本數據的最大集中點 眾數只能傳遞數據中的信息的很少一部分,對極端值不敏感 (1)平均數、中位數和眾數等都是刻畫 的量,它們從不同角度刻畫了一組數據的集中趨勢.平均數反映數據在大小上的中心,中位數反映了數據在位置上的中心,眾數反應數據在數量上的中心 (2)一般地,對數值型數據(如用水量、身高、收入、產量等)集中趨勢的描述,可以用 、 ;而對分類型數據(如校服規格、性別、產品質量等級等)集中趨勢的描述,可以用 . “中心位置” 平均數 中位數 眾數 2.總體集中趨勢的估計 3.用頻率分布直方圖估計眾數、中位數、平均數: (1)平均數:在頻率分布直方圖中,樣本平均數可以用每個小矩形底邊中點的橫坐標與小矩形的面積的乘積之和近似代替. (2)中位數:在頻率分布直方圖中,中位數左邊和右邊的直方圖的面積應該相等,也就是50%分位數. (3)眾數:眾數是最高小矩形底邊的中點所對應的數據. 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫