資源簡介 第01講 隨機抽樣、統計圖表、用樣本估計總體目錄01 考情透視·目標導航 202 知識導圖·思維引航 303 考點突破·題型探究 4知識點1:抽樣 4知識點2:用樣本估計總體 5題型一:隨機抽樣、分層抽樣 7題型二:統計圖表 8題型三:頻率分布直方圖 11題型四:百分位數 13題型五:樣本的數字特征 14題型六:總體集中趨勢的估計 15題型七:總體離散程度的估計 17題型八:分層方差問題 2104真題練習·命題洞見 2505課本典例·高考素材 2606易錯分析·答題模板 28易錯點:不能正確提取圖表信息 28答題模板:求百分位數 29考點要求 考題統計 考情分析(1)抽樣方法 (2)統計圖表 (3)頻率分布直方圖 (4)樣本的數字特征的估計,總體集中趨勢的估計,總體離散程度的估計 2024年II卷第4題,5分 2023年上海卷第14題,4分 2023年上海卷第9題,5分 2023年I卷第9題,5分 2022年甲卷(文)第2題,5分 統計學是“大數據”技術的關鍵,在互聯網時代具有強大的社會價值和經濟價值,在高考中受重視程度越來越大,未來在考試中的出題角度會更加與實際生活緊密聯系,背景新顥、形式多樣.復習目標: (1)會用簡單隨機抽樣的方法從總體中抽取樣本,了解分層隨機抽樣. (2)理解統計圖表的含義. (3)會用統計圖表對總體進行估計,會求n個數據的第p百分位數. (4)能用數字特征估計總體集中趨勢和總體離散程度.知識點1:抽樣1、抽樣調查(1)總體:統計中所考察對象的某一數值指標的全體構成的集合稱為總體.(2)個體:構成總體的每一個元素叫做個體.(3)樣本:從總體中抽取若干個個體進行考察,這若干個個體所構成的集合叫做總體的一個樣本,樣本中個體的數目叫做樣本容量.2、簡單隨機抽樣(1)定義一般地,設一個總體含有個個體,從中逐個不放回地抽取個個體作為樣本(),如果每次抽取時總體內的各個個體被抽到的機會都相等,就把這種抽樣方法叫做簡單隨機抽樣.這樣抽取的樣本,叫做簡單隨機樣本.(2)兩種常用的簡單隨機抽樣方法①抽簽法:一般地,抽簽法就是把總體中的個個體編號,把號碼寫在號簽上,將號簽放在一個容器中,攪拌均勻后,每次從中抽取一個號簽,連續抽取次,就得到一個容量為的樣本.②隨機數法:即利用隨機數表、隨機數骰子或計算機產生的隨機數進行抽樣.這里僅介紹隨機數表法.隨機數表由數字,,,…,組成,并且每個數字在表中各個位置出現的機會都是一樣的.注意:為了保證所選數字的隨機性,需在查看隨機數表前就指出開始數字的橫、縱位置.(3)抽簽法與隨機數法的適用情況抽簽法適用于總體中個體數較少的情況,隨機數法適用于總體中個體數較多的情況,但是當總體容量很大時,需要的樣本容量也很大時,利用隨機數法抽取樣本仍不方便.(4)簡單隨機抽樣的特征①有限性:簡單隨機抽樣要求被抽取的樣本的總體個數是有限的,便于通過樣本對總體進行分析.②逐一性:簡單隨機抽樣是從總體中逐個地進行抽取,便于實踐中操作.③不放回性:簡單隨機抽樣是一種不放回抽樣,便于進行有關的分析和計算.④等可能性:簡單單隨機抽樣中各個個體被抽到的機會都相等,從而保證了抽樣方法的公平.只有四個特點都滿足的抽樣才是簡單隨機抽樣.3、分層抽樣(1)定義一般地,在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法叫做分層抽樣.分層抽樣適用于已知總體是由差異明顯的幾部分組成的.(2)分層抽樣問題類型及解題思路①求某層應抽個體數量:按該層所占總體的比例計算.②已知某層個體數量,求總體容量或反之求解:根據分層抽樣就是按比例抽樣,列比例式進行計算.③分層抽樣的計算應根據抽樣比構造方程求解,其中“抽樣比==”注意:分層抽樣時,每層抽取的個體可以不一樣多,但必須滿足抽取()個個體(其中是層數,是抽取的樣本容量,是第層中個體的個數,是總體容量).【診斷自測】某校老年、中年和青年教師的人數如表所示,采用分層抽樣的方法調查教師的身體狀況,在抽取的樣本中,青年教師有32人,則該樣本的老年教師人數為 .類別 老年教師 中年教師 青年教師 合計人數 36 72 64 172知識點2:用樣本估計總體1、頻率分布直方圖(1)頻率、頻數、樣本容量的計算方法①×組距=頻率.②=頻率,=樣本容量,樣本容量×頻率=頻數.③頻率分布直方圖中各個小方形的面積總和等于.2、頻率分布直方圖中數字特征的計算(1)最高的小長方形底邊中點的橫坐標即是眾數.(2)中位數左邊和右邊的小長方形的面積和是相等的.設中位數為,利用左(右)側矩形面積之和等于,即可求出.(3)平均數是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積乘以小長方形底邊中點的橫坐標之和,即有,其中為每個小長方形底邊的中點,為每個小長方形的面積.3、百分位數(1)定義一組數據的第百分位數是這樣一個值,它使得這組數據中至少有的數據小于或等于這個值,且至少有的數據大于或等于這個值.(2)計算一組個數據的的第百分位數的步驟①按從小到大排列原始數據.②計算.③若不是整數而大于的比鄰整數,則第百分位數為第項數據;若是整數,則第百分位數為第項與第項數據的平均數.(3)四分位數我們之前學過的中位數,相當于是第百分位數.在實際應用中,除了中位數外,常用的分位數還有第百分位數,第百分位數.這三個分位數把一組由小到大排列后的數據分成四等份,因此稱為四分位數.4、樣本的數字特征(1)眾數、中位數、平均數①眾數:一組數據中出現次數最多的數叫眾數,眾數反應一組數據的多數水平.②中位數:將一組數據按大小順序依次排列,把處在最中間位置的一個數據(或最中間兩個數據的平均數)叫做這組數據的中位數,中位數反應一組數據的中間水平.③平均數:個樣本數據的平均數為,反應一組數據的平均水平,公式變形:.5、標準差和方差(1)定義①標準差:標準差是樣本數據到平均數的一種平均距離,一般用表示.假設樣本數據是,表示這組數據的平均數,則標準差.②方差:方差就是標準差的平方,即.顯然,在刻畫樣本數據的分散程度上,方差與標準差是一樣的.在解決實際問題時,多采用標準差.(2)數據特征標準差、方差描述了一組數據圍繞平均數波動程度的大小.標準差、方差越大,則數據的離散程度越大;標準差、方差越小,數據的離散程度越小.反之亦可由離散程度的大小推算標準差、方差的大小.(3)平均數、方差的性質如果數據的平均數為,方差為,那么①一組新數據的平均數為,方差是.②一組新數據的平均數為,方差是.③一組新數據的平均數為,方差是.【診斷自測】某市為提高市民對文明城市創建的認識,舉辦了“創建文明城市”知識競賽,從所有答卷中隨機抽取100份作為樣本,將樣本的成績(滿分100分,成績均為不低于40分的整數)分成六段:,得到如圖所示的頻率分布直方圖.(1)求頻率分布直方圖中a的值;(2)求樣本成績的;(3)已知落在的平均成績是54,方差是7,落在的平均成績為66,方差是4,求兩組成績的總平均數和總方差.題型一:隨機抽樣、分層抽樣【典例1-1】從24名數學教師,16名物理教師,8名化學教師中,用分層抽樣的方法抽取一個容量為6的樣本,則抽取數學教師的人數是( )A.1 B.2 C.3 D.4【典例1-2】總體由編號為01,02,…,30的30個個體組成.利用所給的隨機數表選取6個個體,選取的方法是從隨機數表第1行的第3列開始,由左到右一次選取兩個數字,則選出來的第5個個體的編號為( )(第一行)1712 1340 3320 3826 1389 5103 7417 7637(第二行)1304 0774 2119 3056 6218 3735 9683 5087A.20 B.26 C.17 D.03【方法技巧】不論哪種抽樣方法,總體中的每一個個體入樣的概率都是相同的.【變式1-1】一批熱水器共有98臺,其中甲廠生產的有56臺,乙廠生產的有42臺,用分層抽樣法從中抽出一個容量為14的樣本,那么甲、乙兩廠各抽得的熱水器臺數是( )A.甲廠9臺,乙廠5臺 B.甲廠8 臺,乙廠6臺C.甲廠 10 臺,乙廠4臺 D.甲廠7臺,乙廠7臺【變式1-2】(2024·福建泉州·模擬預測)從一個含有個個體的總體中抽取一容量為的樣本,當選取抽簽法、隨機數法和分層隨機抽樣三種不同方法時,總體中每個個體被抽中的概率分別為,三者關系可能是( )A. B. C. D.【變式1-3】(2024·陜西西安·一模)某高校對中文系新生進行體測,利用隨機數表對650名學生進行抽樣,先將650名學生進行編號,001,002,…,649,650.從中抽取50個樣本,下圖提供隨機數表的第4行到第6行,若從表中第5行第6列開始向右讀取數據,則得到的第6個樣本編號是( )32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 4284 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45A.623 B.328 C.072 D.457題型二:統計圖表【典例2-1】(2024·安徽馬鞍山·模擬預測)下圖為國家統計局給出的2016-2020年福利彩票銷售額、增長率及籌集公益金情況統計圖,則下列說法正確的是( ) A.2016-2020年福利彩票銷售額呈遞減趨勢B.2016-2020年福利彩票銷售額的年增長率呈遞減趨勢C.2016-2020年福利彩票銷售額、籌集公益金均在2018年取得最大值D.2017-2018年福利彩票銷售額增長的最多【典例2-2】(2024·四川達州·二模)下圖是某地區2016-2023年旅游收入(單位:億元)的條形圖,則下列說法錯誤的是( ) A.該地區2016-2019年旅游收入逐年遞增B.該地區2016-2023年旅游收入的中位數是4.30C.經歷了疫情之后,該地區2023年旅游收入恢復到接近2018年水平D.該地區2016-2023年旅游收入的極差是3.69【方法技巧】統計圖表的主要應用扇形圖:直觀描述各類數據占總數的比例;折線圖:描述數據隨時間的變化趨勢;條形圖和直方圖:直觀描述不同類別或分組數據的頻數和頻率.【變式2-1】(2024·陜西銅川·模擬預測)已知某地區中小學生人數和近視情況分別如圖甲和圖乙所示.為了了解該地區中小學生近視情況形成的原因,采用分層抽樣的方法抽取部分學生進行調查,若抽取的小學生人數為70,則抽取的高中生中近視人數為( )A.10 B.20 C.25 D.40【變式2-2】(2024·江西·二模)下圖是我國年純電動汽車銷量統計情況,則下列說法錯誤的是( ) A.我國純電動汽車銷量呈現逐年增長趨勢B.這六年銷量的第60百分位數為536.5萬輛C.2020年銷量高于這六年銷量的平均值D.這六年增長率最大的為2019年至2020年【變式2-3】(2024·四川遂寧·三模)某調查機構對某地快遞行業從業者進行調查統計,得到快遞行業從業人員年齡分布餅狀圖(圖1)、“90后”從事快遞行業崗位分布條形圖(圖2),則下列結論中錯誤的是( )A.快遞行業從業人員中,“90后”占一半以上B.快遞行業從業人員中,從事技術崗位的“90后”的人數超過總人數的20%C.快遞行業從業人員中,從事運營崗位的“90后”的人數比“80前”的多D.快遞行業從業人員中,從事技術崗位的“90后”的人數比“80后”的多【變式2-4】(2024·陜西西安·模擬預測)2017年至2022年某省年生產總量及其增長速度如圖所示,則下列結論錯誤的是( )A.2017年至2022年該省年生產總量逐年增加B.2017年至2022年該省年生產總量的極差為14842.3億元C.2017年至2022年該省年生產總量的增長速度逐年降低D.2017年至2022年該省年生產總量的增長速度的中位數為7.6%題型三:頻率分布直方圖【典例3-1】(2024·河北石家莊·三模)為了解全市高三學生的體能素質情況,在全市高三學生中隨機抽取了1000名學生進行體能測試,并將這1000名學生的體能測試成績整理成如下頻率分布直方圖.則直方圖中實數的值為 .【典例3-2】為貫徹五育并舉的教育方針,某校對全體高一年級學生進行了體育測試,并將成績(單位:分)分為6組:加以統計,得到如圖所示的頻率分布直方圖.已知高一年級共有750名同學參加測試,則成績達標的(不少于60分)學生人數為 .【方法技巧】(1)利用頻率分布直方圖求頻率、頻數;(2)利用頻率分布直方圖估計總體.(3)頻率分布直方圖的縱坐標是 ,而不是頻率.【變式3-1】在某地區進行流行病學調查,隨機調查了100位某種疾病患者的年齡,得到如下的樣本數據的頻率分布直方圖,由此可估計該地區一位這種疾病患者的年齡位于區間的概率為 .【變式3-2】某研究小組經過研究發現某種疾病的患病者與未患病者的某項醫學指標有明顯差異,經過大量調查,得到如下的患病者和未患病者該指標的頻率分布直方圖:利用該指標制定一個檢測標準,需要確定臨界值c,將該指標大于c的人判定為陽性,小于或等于c的人判定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,記為;誤診率是將未患病者判定為陽性的概率,記為.假設數據在組內均勻分布,以事件發生的頻率作為相應事件發生的概率.則當漏診率時,誤診率 .【變式3-3】某研究小組經過研究發現某種疾病的患病者與未患病者的某項醫學指標有明顯差異,經過大量調查,得到如下的患病者和未患病者該指標的頻率分布直方圖:利用該指標制定一個檢測標準,需要確定臨界值,將該指標大于的人判定為陽性,小于或等于的人判定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,記為;誤診率是將未患病者判定為陽性的概率,記為.假設數據在組內均勻分布,以事件發生的頻率作為相應事件發生的概率.設函數,則當時,在區間的最小值為 .題型四:百分位數【典例4-1】(2024·高三·山東菏澤·開學考試)已知一組數據為,則這組數據第60百分位數為 .【典例4-2】已知18個整數的中位數為5,第75百分位數也為5,那么這18個數中,5的個數的最小可能值為 .【方法技巧】計算一組個數據的的第百分位數的步驟①按從小到大排列原始數據.②計算.③若不是整數而大于的比鄰整數,則第百分位數為第項數據;若是整數,則第百分位數為第項與第項數據的平均數.【變式4-1】某同學在高三階段的9次數學考試中成績依次為:,則這9次數學成績的上四分位數為 .【變式4-2】《中國居民膳食指南(2022)》數據顯示,歲至歲兒童青少年超重肥胖率高達為了解某地中學生的體重情況,某機構從該地中學生中隨機抽取名學生,測量他們的體重單位:千克,根據測量數據,按,,,,,分成六組,得到的頻率分布直方圖如圖所示,根據調查的數據,估計該地中學生體重的分位數是 .【變式4-3】第33屆夏季奧林匹克運動會女子10米跳臺跳水決賽中,全紅禪以425.60分的高分拿下冠軍.下面統計某社團一位運動員10次跳臺跳水的訓練成績:68,80,74,63,66,84,78,66,70,76,則這組數據的60%分位數為 .【變式4-4】(2024·高三·全國·單元測試)某公司對來應聘的人進行筆試,統計出200名應聘者的筆試成績,整理得到下表:組號 1 2 3 4 5 6成績分組累積頻率 0.05 0.15 a注:第n組的累積頻率指的是前n組的頻率之和.若公司計劃150人進入面試,則估計參加面試的最低分數線為 .題型五:樣本的數字特征【典例5-1】(2024·高三·全國·單元測試)已知一組統計數據的平均數為,方差為,則函數的最小值為 .【典例5-2】(2024·高三·四川樂山·開學考試)已知,,...,的平均數為10,標準差為2,則,,...,的平均數和標準差分別為 和 .【方法技巧】(1)平均數、中位數、眾數描述其集中趨勢,方差和標準差描述波動大小.(2)方差的簡化計算公式:或寫成,即方差等于原數據平方的平均數減去平均數的平方.【變式5-1】(2024·福建龍巖·三模)互不相等的4個正整數從小到大排序為,若它們的平均數為4,且這4個數據的極差是中位數的2倍,則這4個數據的中位數為 .【變式5-2】(多選題)(2024·江西新余·模擬預測)已知對個數據做如下變換:當為奇數時,對應的變為;當為偶數時,對應的變為,則對于該組數據的變化,下列情況中可能發生的是:( ).A.平均數增大 B.方差不變C.分位數減小 D.眾數減小【變式5-3】(多選題)(2024·湖北·模擬預測)設一組樣本數據滿足,則( )A.拿走,這組數據的方差變大 B.拿走,這組數據的方差變大C.拿走,這組數據的方差減小 D.拿走,這組數據的方差減小【變式5-4】已知一組數據,,,的方差為4,若數據,,,的方差為36,則b的值為 .【變式5-5】(多選題)一個同學投擲10次骰子,記錄出現的點數,根據統計結果,在下列情況中可能出現點數6的有( )A.平均數為3,中位數為4B.中位數為4,眾數為3C.平均數為2,方差為2.1D.中位數為3,方差為0.85題型六:總體集中趨勢的估計【典例6-1】為了解甲 乙兩種離子在小鼠體內的殘留程度,進行如下試驗:將200只小鼠隨機分成兩組,每組只,其中組小鼠給服甲離子溶液,組小鼠給服乙離子溶液.每只小鼠給服的溶液體積相同 摩爾濃度相同.經過一段時間后用某種科學方法測算出殘留在小鼠體內離子的百分比.根據試驗數據分別得到如下直方圖:記為事件:“乙離子殘留在體內的百分比不高于”,根據直方圖得到的估計值為.(1)求乙離子殘留百分比直方圖中的值;(2)求甲離子殘留百分比的第百分位數;(3)估計乙離子殘留百分比的均值.(同一組數據用該組區間的中點值為代表)【典例6-2】某校抽取100名高二學生期中考試的語文成績,繪制頻率分布直方圖(如圖所示),其中樣本數據分組區間為:. (1)求頻率分布直方圖中的值;(2)根據頻率分布直方圖,估計這100名學生語文成績的眾數和平均數.【方法技巧】頻率分布直方圖的數字特征(1)眾數:最高矩形的底邊中點的橫坐標.(2)中位數:中位數左邊和右邊的矩形的面積和應該相等.(3)平均數:平均數在頻率分布直方圖中等于各組區間的中點值與對應頻率之積的和.【變式6-1】某校從參加高二年級學業水平測試的學生中抽出80名學生,其數學成績(均為整數,單位:分)的頻率分布直方圖如圖所示. (1)求這次測試數學成績的眾數;(2)求這次測試數學成績的中位數.(3)延伸探究:若本例的條件不變,求數學成績的平均分.(4)若本例條件不變,求80分以下的學生人數.【變式6-2】為了落實習主席提出“綠水青山就是金山銀山”的環境治理要求.某市政府積極鼓勵居民節約用水.計劃調整居民生活用水收費方案.擬確定一個合理的月用水量標準x(噸).一位居民的月用水量不超過x的部分按平價收費.超出x的部分按議價收費.為了了解居民用水情況.通過抽樣.獲得了某年200位居民每人的月均用水量(單位:噸).將數據按照[0.1).[1.2).….[8.9)分成9組.制成了如圖所示的頻率分布直方圖.其中0.4a=b.(1)求直方圖中a.b的值.并由頻率分布直方圖估計該市居民用水量的眾數;(2)若該市政府希望使85%的居民每月的用水量不超過標準x(噸).估計x的值.題型七:總體離散程度的估計【典例7-1】(2024·全國·模擬預測)某廠為提高工作效率,將全廠分為甲、乙2個車間,每個車間分別設有A,B,C,D,E5組.下表為該廠某日生產訂單情況統計表,請據表解答下列問題:A B C D E甲車間 100 120 150 180 200乙車間 50 120 200 150 180(1)求甲、乙2個車間該日生產訂單的平均數與方差,并根據方差判斷哪一個車間工作效率比較穩定?(2)設甲車間合格率為0.54,乙車間合格率為0.57,求甲、乙2個車間都不合格的概率;(3)你認為哪個車間工作效率更高?請從平均數、方差、合格率的角度分析.【典例7-2】某校高一(1)班、(2)班的學生人數分別為40,42,在某次測驗中,記(1)班所有學生的成績分別為,,…,,平均成績為,方差為,已知,.(1)求,;(2)記(2)班所有學生的成績分別為,,…,,其平均成績為82,,試求兩個班的所有學生的平均成績(結果保留整數),并說明哪一個班的成績比較穩定.【方法技巧】總體離散程度的估計標準差(方差)反映了數據的離散與集中、波動與穩定的程度.標準差(方差)越大,數據的離散程度越大;標準差(方差)越小,數據的離散程度越小.【變式7-1】在2024年世界泳聯跳水世界杯蒙特利爾站和柏林站女子10米臺跳水決賽中,全紅嬋奉獻了高水準的精彩表現,在決賽中的五個動作驚艷了全世界.在這兩場決賽中,7名裁判給選手的五個跳水動作打分,兩站裁判對全紅嬋的打分記錄如下:(為了方便計算,采取分數四舍五入取整)A組(蒙特利爾站):80 80 82 78 93B組(柏林站):81 80 86 99 86(1)請寫出這10個分數的眾數、極差以及A,B兩組各自的平均成績;(2)請你根據所學的統計知識,分析兩站比賽中,哪一站全紅嬋發揮更穩定?并說明理由.【變式7-2】(2024·云南昆明·三模)甲、乙兩位同學組成學習小組進行項目式互助學習,在共同完成某個內容的互助學習后,甲、乙都參加了若干次測試,現從甲的測試成績里隨機抽取了7次成績,從乙的測試成績里隨機抽取了9次成績,數據如下:甲:93 95 81 72 80 82 92乙:85 82 77 80 94 86 92 84 85經計算得出甲、乙兩人的測試成績的平均數均為85.(1)求甲乙兩位同學測試成績的方差;(2)為檢驗兩組數據的差異性是否顯著,可以計算統計量,其中個數據的方差為,個數據的方差為,且.若,則認為兩組數據有顯著性差異,否則不能認為兩組數據有顯著性差異.若的臨界值采用下表中的數據:1 2 3 4 5 6 7 81 161 200 216 225 230 234 237 2392 18.5 19.0 19.2 19.2 19.3 19.3 19.4 19.43 10.1 9.55 9.28 9.12 9.01 8.94 8.89 8.854 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.045 6.61 5.79 5.41 6.19 5.05 4.95 4.88 4.826 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.157 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.738 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44例如:對應的臨界值為5.41.請根據以上資料判斷甲、乙兩位同學進行項目式互助學習的效果是否有顯著性差異.【變式7-3】(2024·寧夏銀川·一模)濱海鹽堿地是我國鹽堿地的主要類型之一,如何利用更有效的方法改造這些寶貴的土地資源,成為擺在我們面前的世界級難題.對鹽堿的治理方法,研究人員在長期的實踐中獲得了兩種成本差異不大,且能降低濱海鹽堿地土壤層可溶性鹽含量的技術,為了對比兩種技術治理鹽堿的效果,科研人員在同一區域采集了12個土壤樣本,平均分成A、B兩組,測得A組土壤可溶性鹽含量數據樣本平均數,方差,B組土壤可溶性鹽含量數據樣本平均數,方差.用技術1對A組土壤進行可溶性鹽改良試驗,用技術2對B組土壤進行可溶性鹽改良試驗,分別獲得改良后土壤可溶性鹽含量數據如下:A組 0.66 0.68 0.69 0.71 0.72 0.74B組 0.46 0.48 0.49 0.49 0.51 0.54改良后A組、B組土壤可溶性鹽含量數據樣本平均數分別為和,樣本方差分別記為和.(1)求;(2)應用技術1與技術2土壤可溶性鹽改良試驗后,土壤可溶性鹽含量是否有顯著降低?(若,則認為技術能顯著降低土壤可溶性鹽含量,否則不認為有顯著降低.)【變式7-4】(2024·高三·青海西寧·開學考試)某新能源汽車配件廠生產一種新能源汽車精密零件,為提高產品質量引入了一套新生產線,為檢驗新生產線所生產出來的零件質量有無顯著提高,現同時用舊生產線和新生產線各生產了10個零件,得到各個零件的質量指標的數據如下:舊生產線 5.2 4.8 4.8 5.0 5.0 5.2 5.1 4.8 5.1 5.0新生產線 5.0 5.2 5.3 5.1 5.4 5.2 5.2 5.3 5.2 5.1設舊生產線和新生產線所生產零件的質量指標的樣本平均數分別為和,樣本方差分別為和.(1)求,及;(2)若,則認為新生產線生產零件的質量有顯著提高,否則不認為有顯著提高,現計算得,試判斷新生產線生產的零件質量較舊生產線生產的零件質量是否有顯著提高.【變式7-5】(2024·高三·黑龍江雞西·期末)為了了解甲、乙兩個工廠生產的輪胎的寬度是否達標,分別從兩廠隨機選取了10個輪胎,將每個輪胎的寬度(單位:)記錄下來并繪制出折線圖:(1)分別計算甲、乙兩廠提供10個輪胎寬度的平均值;(2)輪胎的寬度在內,則稱這個輪胎是標準輪胎.試比較甲、乙兩廠分別提供的10個輪胎中所有標準輪胎寬度的方差的大小,根據兩廠的標準輪胎寬度的平均水平及其波動情況,判斷這兩個工廠哪個廠的輪胎相對更好 題型八:分層方差問題【典例8-1】(2024·廣東珠海·一模)甲、乙兩班參加了同一學科的考試,其中甲班50人,乙班40人.甲班的平均成績為72分,方差為90分;乙班的平均成績為90分,方差為60分.那么甲、乙兩班全部90名學生的平均成績是 分,方差是 分.【典例8-2】(2024·山西太原·二模)為獲得某校高一年級全體學生的身高信息,現采用樣本量按比例分配的分層隨機抽樣方法抽取了一個樣本,其中有30名男生和20名女生,計算得男生樣本的均值為170,方差為15.女生樣本的均值為160,方差為30,則由上述數據計算該校高一年級學生身高的均值是 ,方差是 .【方法技巧】分層隨機抽樣的方差設樣本容量為,平均數為,其中兩層的個體數量分別為,兩層的平均數分別為,,方差分別為,則這個樣本的方差為【變式8-1】為培養學生的閱讀習慣,某校開展了為期一年的“弘揚傳統文化,閱讀經典名著”活動.在了解全校學生每年平均閱讀了多少本文學經典名著時,甲同學抽取了一個容量為10的樣本,并算得樣本的平均數為5,方差為9;乙同學抽取了一個容量為8的樣本,并算得樣本的平均數為6,方差為16.已知甲、乙兩同學抽取的樣本合在一起組成一個容量為18的樣本,則合在一起后的樣本平均數為 ,方差為 .(精確到0.1)【變式8-2】(2024·高三·四川·期末)某校有3名百米短跑運動員甲、乙、丙,已知甲最近10次百米短跑的時間(單位:s)的數據如下表:第1次 第2次 第3次 第4次 第5次 第6次 第7次 第8次 第9次 第10次時間/s 12 12.4 12 12.5 12 11.8 12.2 11.5 11.6 12(1)計算甲這10次百米短跑的時間的平均數與方差;(2)經過計算,乙最近10次百米短跑的時間的平均數和方差分別為12,0.08,丙最近10次百米短跑的時間的平均數和方差分別為12.4,0.08,若要從甲、乙、丙三人中選一人代表學校參加市區的百米短跑比賽,請判斷該選擇誰,說明你的理由.【變式8-3】某地區有小學生9000人,初中生8600人,高中生4400人,教育局組織網絡“防溺水”網絡知識問答,現用分層抽樣的方法從中抽取220名學生,對其成績進行統計分析,得到如下圖所示的頻率分布直方圖所示的頻率分布直方圖.(1)根據頻率分布直方圖,估計該地區所有學生中知識問答成績的平均數和眾數;(2)成績位列前10%的學生平臺會生成“防溺水達人”優秀證書,試估計獲得“防溺水達人”的成績至少為多少分;(3)已知落在內的平均成績為67,方差是9,落在內的平均成績是73,方差是29,求落在內的平均成績和方差.(附:設兩組數據的樣本量 樣本平均數和樣本方差分別為:.記兩組數據總體的樣本平均數為,則總體樣本方差)【變式8-4】某校高一年級有男生200人,女生100人.為了解該校全體高一學生的身高信息,按性別比例進行分層隨機抽樣,抽取總樣本為30的樣本,并觀測樣本的指標價(單位:cm),計算得男生樣本的身高平均數為169,方差為39.下表是抽取的女生樣本的數據;抽取次序 1 2 3 4 5 6 7 8 9 10身高 155 158 156 157 160 161 159 162 169 163記抽取的第i個女生的身高為(,2,3,…,10),樣本平均數,方差.參考數據:,,.(1)若用女生樣本的身高頻率分布情況代替該校高一女生總體的身高頻率分布情況,試估計該校高一女生身高在范圍內的人數;(2)用總樣本的平均數和標準差分別估計該校高一學生總體身高的平均數和標準差,求,的值;(3)如果女生樣本數據在之外的數據稱為離群值,試剔除離群值后,計算剩余女生樣本身高的平均數與方差.【變式8-5】2023年10月26日,中國的神舟十七號載人飛船與“天宮”空間站成功對接,形成三艙三船組合體.某地區為了激發當地人民對天文學的興趣,開展了天文知識比賽,滿分100分(95分及以上為認知程度高),結果認知程度高的有人,這人按年齡分成5組,其中第一組:,第二組:,第三組:,第四組:,第五組:,得到如圖所示的頻率分布直方圖.已知第一組有10人. (1)根據頻率分布直方圖,估計這人的第60百分位數(精確到0.1);(2)現從第四組和第五組用分層隨機抽樣的方法抽取6人,擔任“黨章黨史”宣傳使者.①有甲(年齡36),乙(年齡42),且甲、乙確定入選,從6人中要選擇兩個人擔任組長,求甲、乙兩人至少有一人被選上組長的概率;②若第四組宣傳使者的年齡的平均數與方差分別為36和,第五組宣傳使者的年齡的平均數與方差分別為42和1,估計這人中35-45歲所有人年齡的平均數和方差.【變式8-6】為進一步推動防范電信網絡詐騙工作,預防和減少電信網絡詐騙案件的發生,某市開展防騙知識大宣傳活動.舉辦了“網絡防騙”知識競賽,從所有答卷中隨機抽取100份作為樣本,將樣本的成績(滿分100分,成績均為不低于40分的整數)分成六段:,,…,得到如圖所示的頻率分布直方圖.(1)求圖中的值,根據頻率分布直方圖計算樣本成績的平均數和下四分位數;(2)已知若總體劃分為2層,通過分層隨機抽樣,各層抽取的樣本量、樣本平均數和樣本方差分別為:,,;,,,記總的樣本平均數為,樣本方差為.證明:;(3)已知落在的平均成績是59,方差是7,落在的平均成績為65,方差是4,求兩組樣本成績的總平均數和總方差.1.(多選題)(2023年新課標全國Ⅰ卷數學真題)有一組樣本數據,其中是最小值,是最大值,則( )A.的平均數等于的平均數B.的中位數等于的中位數C.的標準差不小于的標準差D.的極差不大于的極差2.(多選題)(2021年全國新高考II卷數學試題)下列統計量中,能度量樣本的離散程度的是( )A.樣本的標準差 B.樣本的中位數C.樣本的極差 D.樣本的平均數3.(多選題)(2021年全國新高考I卷數學試題)有一組樣本數據,,…,,由這組數據得到新樣本數據,,…,,其中(為非零常數,則( )A.兩組樣本數據的樣本平均數相同B.兩組樣本數據的樣本中位數相同C.兩組樣本數據的樣本標準差相同D.兩組樣本數據的樣本極差相同4.(2021年天津高考數學試題)從某網絡平臺推薦的影視作品中抽取部,統計其評分數據,將所得個評分數據分為組:、、、,并整理得到如下的頻率分布直方圖,則評分在區間內的影視作品數量是( )A. B. C. D.5.(2021年全國高考甲卷數學(理)試題)為了解某地農村經濟情況,對該地農戶家庭年收入進行抽樣調查,將農戶家庭年收入的調查數據整理得到如下頻率分布直方圖:根據此頻率分布直方圖,下面結論中不正確的是( )A.該地農戶家庭年收入低于4.5萬元的農戶比率估計為6%B.該地農戶家庭年收入不低于10.5萬元的農戶比率估計為10%C.估計該地農戶家庭年收入的平均值不超過6.5萬元D.估計該地有一半以上的農戶,其家庭年收入介于4.5萬元至8.5萬元之間1.某校舉行演講比賽,10位評委對兩位選手的評分如下:甲 7.5 7.5 7.8 7.8 8.0 8.0 8.2 8.3 8.4 9.9乙7.5 7.8 7.8 7.8 8.0 8.0 8.3 8.3 8.5 8.5選手的最終得分為去掉一個最低分和一個最高分之后,剩下8個評分的平均數.那么,這兩個選手的最(1);(2).易錯點:不能正確提取圖表信息易錯分析: 在頻率分布直方圖中,各小長方形的面積的總和等于1.切記等高的小矩形的個數不要有遺漏.另外,還要注意頻率分布條形圖和頻率分布直方圖是兩個完全不同的概念,雖然它們的橫軸表示的內容是相同的,但是頻率分布條形圖的縱軸(矩形的高)表示頻率;頻率分布直方圖的縱軸(矩形的高)表示頻率與組距的比值,其各小組的頻率等于該小組上矩形的面積.【易錯題1】下表為某小區居民用戶月均用水量數據的頻數分布表(單位:噸):分組頻數 23 42 21 8 6由該頻數分布表畫出的頻數分布直方圖中,各組長方形的高度之和為 ;由該頻數分布表畫出的頻率分布直方圖中,各組長方形的高度之和為 .【易錯題2】某大學有男生名.為了解該校男生的身體體重情況,隨機抽查了該校名男生的體重,并將這名男生的體重(單位:)分成以下六組:、、、、、,繪制成如下的頻率分布直方圖:該校體重(單位:)在區間上的男生大約有 人.答題模板:求百分位數1、模板解決思路解決本模板問題要理解百分位數的定義,嚴格按照百分位數的計算步驟求解.2、模板解決步驟第一步:按從小到大排列原始數據.第二步:計算.第三步:若不是整數而大于的比鄰整數,則第百分位數為第項數據;若是整數,則第百分位數為第項與第項數據的平均數.【經典例題1】現有一組數據按照從小到大的順序排列如下:4,6,7,7,8,9,11,14,15,19,則這組數據的上四分位數為 .【經典例題2】某機構研究得出10名肺炎病患者的潛伏期(單位:天)分別為8,12,11,7,9,17,14,13,12,15,則這10個數據的第70百分位數是 .21世紀教育網(www.21cnjy.com)第01講 隨機抽樣、統計圖表、用樣本估計總體目錄01 考情透視·目標導航 202 知識導圖·思維引航 303 考點突破·題型探究 4知識點1:抽樣 4知識點2:用樣本估計總體 5題型一:隨機抽樣、分層抽樣 8題型二:統計圖表 10題型三:頻率分布直方圖 14題型四:百分位數 16題型五:樣本的數字特征 19題型六:總體集中趨勢的估計 23題型七:總體離散程度的估計 25題型八:分層方差問題 3204真題練習·命題洞見 3905課本典例·高考素材 4206易錯分析·答題模板 45易錯點:不能正確提取圖表信息 45答題模板:求百分位數 46考點要求 考題統計 考情分析(1)抽樣方法 (2)統計圖表 (3)頻率分布直方圖 (4)樣本的數字特征的估計,總體集中趨勢的估計,總體離散程度的估計 2024年II卷第4題,5分 2023年上海卷第14題,4分 2023年上海卷第9題,5分 2023年I卷第9題,5分 2022年甲卷(文)第2題,5分 統計學是“大數據”技術的關鍵,在互聯網時代具有強大的社會價值和經濟價值,在高考中受重視程度越來越大,未來在考試中的出題角度會更加與實際生活緊密聯系,背景新顥、形式多樣.復習目標: (1)會用簡單隨機抽樣的方法從總體中抽取樣本,了解分層隨機抽樣. (2)理解統計圖表的含義. (3)會用統計圖表對總體進行估計,會求n個數據的第p百分位數. (4)能用數字特征估計總體集中趨勢和總體離散程度.知識點1:抽樣1、抽樣調查(1)總體:統計中所考察對象的某一數值指標的全體構成的集合稱為總體.(2)個體:構成總體的每一個元素叫做個體.(3)樣本:從總體中抽取若干個個體進行考察,這若干個個體所構成的集合叫做總體的一個樣本,樣本中個體的數目叫做樣本容量.2、簡單隨機抽樣(1)定義一般地,設一個總體含有個個體,從中逐個不放回地抽取個個體作為樣本(),如果每次抽取時總體內的各個個體被抽到的機會都相等,就把這種抽樣方法叫做簡單隨機抽樣.這樣抽取的樣本,叫做簡單隨機樣本.(2)兩種常用的簡單隨機抽樣方法①抽簽法:一般地,抽簽法就是把總體中的個個體編號,把號碼寫在號簽上,將號簽放在一個容器中,攪拌均勻后,每次從中抽取一個號簽,連續抽取次,就得到一個容量為的樣本.②隨機數法:即利用隨機數表、隨機數骰子或計算機產生的隨機數進行抽樣.這里僅介紹隨機數表法.隨機數表由數字,,,…,組成,并且每個數字在表中各個位置出現的機會都是一樣的.注意:為了保證所選數字的隨機性,需在查看隨機數表前就指出開始數字的橫、縱位置.(3)抽簽法與隨機數法的適用情況抽簽法適用于總體中個體數較少的情況,隨機數法適用于總體中個體數較多的情況,但是當總體容量很大時,需要的樣本容量也很大時,利用隨機數法抽取樣本仍不方便.(4)簡單隨機抽樣的特征①有限性:簡單隨機抽樣要求被抽取的樣本的總體個數是有限的,便于通過樣本對總體進行分析.②逐一性:簡單隨機抽樣是從總體中逐個地進行抽取,便于實踐中操作.③不放回性:簡單隨機抽樣是一種不放回抽樣,便于進行有關的分析和計算.④等可能性:簡單單隨機抽樣中各個個體被抽到的機會都相等,從而保證了抽樣方法的公平.只有四個特點都滿足的抽樣才是簡單隨機抽樣.3、分層抽樣(1)定義一般地,在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法叫做分層抽樣.分層抽樣適用于已知總體是由差異明顯的幾部分組成的.(2)分層抽樣問題類型及解題思路①求某層應抽個體數量:按該層所占總體的比例計算.②已知某層個體數量,求總體容量或反之求解:根據分層抽樣就是按比例抽樣,列比例式進行計算.③分層抽樣的計算應根據抽樣比構造方程求解,其中“抽樣比==”注意:分層抽樣時,每層抽取的個體可以不一樣多,但必須滿足抽取()個個體(其中是層數,是抽取的樣本容量,是第層中個體的個數,是總體容量).【診斷自測】某校老年、中年和青年教師的人數如表所示,采用分層抽樣的方法調查教師的身體狀況,在抽取的樣本中,青年教師有32人,則該樣本的老年教師人數為 .類別 老年教師 中年教師 青年教師 合計人數 36 72 64 172【答案】【解析】在抽取的樣本中,青年教師有32人,而抽樣的比例為,該樣本的老年教師人數為,則有,,故答案為:.知識點2:用樣本估計總體1、頻率分布直方圖(1)頻率、頻數、樣本容量的計算方法①×組距=頻率.②=頻率,=樣本容量,樣本容量×頻率=頻數.③頻率分布直方圖中各個小方形的面積總和等于.2、頻率分布直方圖中數字特征的計算(1)最高的小長方形底邊中點的橫坐標即是眾數.(2)中位數左邊和右邊的小長方形的面積和是相等的.設中位數為,利用左(右)側矩形面積之和等于,即可求出.(3)平均數是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積乘以小長方形底邊中點的橫坐標之和,即有,其中為每個小長方形底邊的中點,為每個小長方形的面積.3、百分位數(1)定義一組數據的第百分位數是這樣一個值,它使得這組數據中至少有的數據小于或等于這個值,且至少有的數據大于或等于這個值.(2)計算一組個數據的的第百分位數的步驟①按從小到大排列原始數據.②計算.③若不是整數而大于的比鄰整數,則第百分位數為第項數據;若是整數,則第百分位數為第項與第項數據的平均數.(3)四分位數我們之前學過的中位數,相當于是第百分位數.在實際應用中,除了中位數外,常用的分位數還有第百分位數,第百分位數.這三個分位數把一組由小到大排列后的數據分成四等份,因此稱為四分位數.4、樣本的數字特征(1)眾數、中位數、平均數①眾數:一組數據中出現次數最多的數叫眾數,眾數反應一組數據的多數水平.②中位數:將一組數據按大小順序依次排列,把處在最中間位置的一個數據(或最中間兩個數據的平均數)叫做這組數據的中位數,中位數反應一組數據的中間水平.③平均數:個樣本數據的平均數為,反應一組數據的平均水平,公式變形:.5、標準差和方差(1)定義①標準差:標準差是樣本數據到平均數的一種平均距離,一般用表示.假設樣本數據是,表示這組數據的平均數,則標準差.②方差:方差就是標準差的平方,即.顯然,在刻畫樣本數據的分散程度上,方差與標準差是一樣的.在解決實際問題時,多采用標準差.(2)數據特征標準差、方差描述了一組數據圍繞平均數波動程度的大小.標準差、方差越大,則數據的離散程度越大;標準差、方差越小,數據的離散程度越小.反之亦可由離散程度的大小推算標準差、方差的大小.(3)平均數、方差的性質如果數據的平均數為,方差為,那么①一組新數據的平均數為,方差是.②一組新數據的平均數為,方差是.③一組新數據的平均數為,方差是.【診斷自測】某市為提高市民對文明城市創建的認識,舉辦了“創建文明城市”知識競賽,從所有答卷中隨機抽取100份作為樣本,將樣本的成績(滿分100分,成績均為不低于40分的整數)分成六段:,得到如圖所示的頻率分布直方圖.(1)求頻率分布直方圖中a的值;(2)求樣本成績的;(3)已知落在的平均成績是54,方差是7,落在的平均成績為66,方差是4,求兩組成績的總平均數和總方差.【解析】(1)由頻率之和為1得,解得.(2)因為成績落在內的頻率為落在內的頻率為所以樣本成績的落在范圍內,設為m,則,解得,故為84.(3)由圖可知,成績在內的市民人數為,成績在內的市民人數為,故.,所以兩組市民成績的總平均數是62,總方差是37.題型一:隨機抽樣、分層抽樣【典例1-1】從24名數學教師,16名物理教師,8名化學教師中,用分層抽樣的方法抽取一個容量為6的樣本,則抽取數學教師的人數是( )A.1 B.2 C.3 D.4【答案】C【解析】從24名數學教師,16名物理教師,8名化學教師中,用分層抽樣的方法抽取一個容量為6的樣本,則應抽取的數學教師人數是人.故選:C.【典例1-2】總體由編號為01,02,…,30的30個個體組成.利用所給的隨機數表選取6個個體,選取的方法是從隨機數表第1行的第3列開始,由左到右一次選取兩個數字,則選出來的第5個個體的編號為( )(第一行)1712 1340 3320 3826 1389 5103 7417 7637(第二行)1304 0774 2119 3056 6218 3735 9683 5087A.20 B.26 C.17 D.03【答案】D【解析】從隨機數表第1行的第3列開始,由左到右一次選取兩個數字,選出的編號依次為:12,13,40,33,20,38,26,13,89,51,03,…,剔除掉總體編號以外的編號,以及重復的編號,則選出來的個體的編號依次為:12,13,20,26,03,…,所以選出來的第5個個體的編號為03.故選:.【方法技巧】不論哪種抽樣方法,總體中的每一個個體入樣的概率都是相同的.【變式1-1】一批熱水器共有98臺,其中甲廠生產的有56臺,乙廠生產的有42臺,用分層抽樣法從中抽出一個容量為14的樣本,那么甲、乙兩廠各抽得的熱水器臺數是( )A.甲廠9臺,乙廠5臺 B.甲廠8 臺,乙廠6臺C.甲廠 10 臺,乙廠4臺 D.甲廠7臺,乙廠7臺【答案】B【解析】依題意,甲廠抽得的熱水器臺數是,乙廠抽得的熱水器臺數是.故選:B【變式1-2】(2024·福建泉州·模擬預測)從一個含有個個體的總體中抽取一容量為的樣本,當選取抽簽法、隨機數法和分層隨機抽樣三種不同方法時,總體中每個個體被抽中的概率分別為,三者關系可能是( )A. B. C. D.【答案】B【解析】因為在抽簽法抽樣、隨機數法抽樣和分層隨機抽樣中,每個個體被抽中的概率均為,所以.故選:B.【變式1-3】(2024·陜西西安·一模)某高校對中文系新生進行體測,利用隨機數表對650名學生進行抽樣,先將650名學生進行編號,001,002,…,649,650.從中抽取50個樣本,下圖提供隨機數表的第4行到第6行,若從表中第5行第6列開始向右讀取數據,則得到的第6個樣本編號是( )32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 4284 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45A.623 B.328 C.072 D.457【答案】A【解析】從第5行第6列開始向右讀取數據,第一個數為253,第二個數是313,第三個數是457,下一個數是860,不符合要求,下一個數是736,不符合要求,下一個是253,重復,第四個是007,第五個是328,第六個數是623,,故A正確.故選:A.題型二:統計圖表【典例2-1】(2024·安徽馬鞍山·模擬預測)下圖為國家統計局給出的2016-2020年福利彩票銷售額、增長率及籌集公益金情況統計圖,則下列說法正確的是( ) A.2016-2020年福利彩票銷售額呈遞減趨勢B.2016-2020年福利彩票銷售額的年增長率呈遞減趨勢C.2016-2020年福利彩票銷售額、籌集公益金均在2018年取得最大值D.2017-2018年福利彩票銷售額增長的最多【答案】C【解析】對于A,2016-2020年福利彩票銷售額先遞增后遞減,A錯誤;對于B,2016-2020年福利彩票銷售額的年增長率先遞增后遞減,B錯誤;對于C,2016-2020年福利彩票銷售額、籌集公益金均在2018年取得最大值,C正確;對于D,2017-2018年福利彩票銷售額增長75.8億元,2016-2017年福利彩票銷售額增長104.9億元,D錯誤.故選:C【典例2-2】(2024·四川達州·二模)下圖是某地區2016-2023年旅游收入(單位:億元)的條形圖,則下列說法錯誤的是( ) A.該地區2016-2019年旅游收入逐年遞增B.該地區2016-2023年旅游收入的中位數是4.30C.經歷了疫情之后,該地區2023年旅游收入恢復到接近2018年水平D.該地區2016-2023年旅游收入的極差是3.69【答案】B【解析】A:由圖可知該地區2016-2019年旅游收入逐年遞增,故A正確;B:由圖可知,2016-2023年旅游收入的中位數為億元,故B錯誤;C:從圖表可知2023年旅游收入為4.91億元,接近2018年的5.13億元,故C正確;D:2016-2023年旅游收入的極差是億元,故D正確.故選:B.【方法技巧】統計圖表的主要應用扇形圖:直觀描述各類數據占總數的比例;折線圖:描述數據隨時間的變化趨勢;條形圖和直方圖:直觀描述不同類別或分組數據的頻數和頻率.【變式2-1】(2024·陜西銅川·模擬預測)已知某地區中小學生人數和近視情況分別如圖甲和圖乙所示.為了了解該地區中小學生近視情況形成的原因,采用分層抽樣的方法抽取部分學生進行調查,若抽取的小學生人數為70,則抽取的高中生中近視人數為( )A.10 B.20 C.25 D.40【答案】B【解析】由圖甲可知抽取的高中生人數是,又由圖乙可知高中生的近視率為,所以抽取的高中生中近視人數為人.故選:B.【變式2-2】(2024·江西·二模)下圖是我國年純電動汽車銷量統計情況,則下列說法錯誤的是( ) A.我國純電動汽車銷量呈現逐年增長趨勢B.這六年銷量的第60百分位數為536.5萬輛C.2020年銷量高于這六年銷量的平均值D.這六年增長率最大的為2019年至2020年【答案】C【解析】對于A,從條形圖中看出,純電動汽車銷量逐年遞增,故A正確;對于B,因為,將所有汽車銷量數據從小到大排序,所以銷量的第60百分位數為第4個數據,即536.5,故B正確;對于C,這六年銷量的平均數為,故C錯誤;對于D,因為2019年至2020年的增長率為,超過其他年份的增長率,故D正確.故選:C.【變式2-3】(2024·四川遂寧·三模)某調查機構對某地快遞行業從業者進行調查統計,得到快遞行業從業人員年齡分布餅狀圖(圖1)、“90后”從事快遞行業崗位分布條形圖(圖2),則下列結論中錯誤的是( )A.快遞行業從業人員中,“90后”占一半以上B.快遞行業從業人員中,從事技術崗位的“90后”的人數超過總人數的20%C.快遞行業從業人員中,從事運營崗位的“90后”的人數比“80前”的多D.快遞行業從業人員中,從事技術崗位的“90后”的人數比“80后”的多【答案】D【解析】由題圖可知,快遞行業從業人員中,“90后”占總人數的56%,超過一半,A正確;快遞行業從業人員中,從事技術崗位的“90后”的人數占總人數的百分比為,超過20%,所以快遞行業從業人員中,從事技術崗位的“90”后的人數超過總人數的20%;B正確;快遞行業從業人員中,從事運營崗位的“90后”的人數占總人數的百分比為,超過“80前”的人數占總人數的百分比,C正確;快遞行業從業人員中,從事技術崗位的“90后”的人數占總人數的百分比為22.176%,小于“80后”的人數占總人數的百分比,但“80后”從事技術崗位的人數占“80后”人數的比未知,D不一定正確.故選:D【變式2-4】(2024·陜西西安·模擬預測)2017年至2022年某省年生產總量及其增長速度如圖所示,則下列結論錯誤的是( )A.2017年至2022年該省年生產總量逐年增加B.2017年至2022年該省年生產總量的極差為14842.3億元C.2017年至2022年該省年生產總量的增長速度逐年降低D.2017年至2022年該省年生產總量的增長速度的中位數為7.6%【答案】C【解析】對于A,觀察條形圖知,2017年至2022年該省年生產總量逐年增加,A正確;對于B,2017年至2022年該省年生產總量的極差為14842.3(億元),B正確;對于C,2017年至2020年該省年生產總量的增長速度逐年降低,而2021年該省年生產總量的增長速度比2020年該省年生產總量的增長速度高,C錯誤;對于D,2017年至2020年該省年生產總量的增長速度由小到大排列為:,因此增長速度的中位數為,D正確.故選:C題型三:頻率分布直方圖【典例3-1】(2024·河北石家莊·三模)為了解全市高三學生的體能素質情況,在全市高三學生中隨機抽取了1000名學生進行體能測試,并將這1000名學生的體能測試成績整理成如下頻率分布直方圖.則直方圖中實數的值為 .【答案】【解析】由直方圖可知:組距為,所以,解得.故答案為:.【典例3-2】為貫徹五育并舉的教育方針,某校對全體高一年級學生進行了體育測試,并將成績(單位:分)分為6組:加以統計,得到如圖所示的頻率分布直方圖.已知高一年級共有750名同學參加測試,則成績達標的(不少于60分)學生人數為 .【答案】600【解析】根據頻率分布直方圖,成績不低于60分的頻率為,可知該體育測試成績不少于60分的學生人數為.故答案為:【方法技巧】(1)利用頻率分布直方圖求頻率、頻數;(2)利用頻率分布直方圖估計總體.(3)頻率分布直方圖的縱坐標是 ,而不是頻率.【變式3-1】在某地區進行流行病學調查,隨機調查了100位某種疾病患者的年齡,得到如下的樣本數據的頻率分布直方圖,由此可估計該地區一位這種疾病患者的年齡位于區間的概率為 .【答案】【解析】設{一人患這種疾病的年齡在區間},所以.故答案為:【變式3-2】某研究小組經過研究發現某種疾病的患病者與未患病者的某項醫學指標有明顯差異,經過大量調查,得到如下的患病者和未患病者該指標的頻率分布直方圖:利用該指標制定一個檢測標準,需要確定臨界值c,將該指標大于c的人判定為陽性,小于或等于c的人判定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,記為;誤診率是將未患病者判定為陽性的概率,記為.假設數據在組內均勻分布,以事件發生的頻率作為相應事件發生的概率.則當漏診率時,誤診率 .【答案】【解析】依題可知,左邊圖形第一個小矩形的面積為,所以,所以,解得:,由右邊的頻率分布直方圖可得.故答案為:【變式3-3】某研究小組經過研究發現某種疾病的患病者與未患病者的某項醫學指標有明顯差異,經過大量調查,得到如下的患病者和未患病者該指標的頻率分布直方圖:利用該指標制定一個檢測標準,需要確定臨界值,將該指標大于的人判定為陽性,小于或等于的人判定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,記為;誤診率是將未患病者判定為陽性的概率,記為.假設數據在組內均勻分布,以事件發生的頻率作為相應事件發生的概率.設函數,則當時,在區間的最小值為 .【答案】/【解析】當時, ;當時, ,故,所以在區間的最小值為.故答案為:題型四:百分位數【典例4-1】(2024·高三·山東菏澤·開學考試)已知一組數據為,則這組數據第60百分位數為 .【答案】80【解析】將這組數據從小到大排列為:,共8個,因為,所以這組數據第60百分位數為第5個數據,即為80.故答案為:80【典例4-2】已知18個整數的中位數為5,第75百分位數也為5,那么這18個數中,5的個數的最小可能值為 .【答案】6【解析】由題意,將18個整數由小到大排列,中位數為第9位和第10位數的平均數,又,則第75百分位數為第14位數,故第14位數是5,故第9位和第10位數也是5,所以5的個數的最小可能值為6個.故答案為:6【方法技巧】計算一組個數據的的第百分位數的步驟①按從小到大排列原始數據.②計算.③若不是整數而大于的比鄰整數,則第百分位數為第項數據;若是整數,則第百分位數為第項與第項數據的平均數.【變式4-1】某同學在高三階段的9次數學考試中成績依次為:,則這9次數學成績的上四分位數為 .【答案】130【解析】將9次成績分數從小到大排列依次為:98,106,113,119,120,126,130,133,149,由于,故這組成績數據的上四分位數為第7個數130.故答案為:130【變式4-2】《中國居民膳食指南(2022)》數據顯示,歲至歲兒童青少年超重肥胖率高達為了解某地中學生的體重情況,某機構從該地中學生中隨機抽取名學生,測量他們的體重單位:千克,根據測量數據,按,,,,,分成六組,得到的頻率分布直方圖如圖所示,根據調查的數據,估計該地中學生體重的分位數是 .【答案】【解析】因為前2組的頻率和為,前3組的頻率和為,所以分位數在內,設分位數為,則,解得.故答案為:【變式4-3】第33屆夏季奧林匹克運動會女子10米跳臺跳水決賽中,全紅禪以425.60分的高分拿下冠軍.下面統計某社團一位運動員10次跳臺跳水的訓練成績:68,80,74,63,66,84,78,66,70,76,則這組數據的60%分位數為 .【答案】75【解析】先將成績進行排序:63,66,66,68,70,74,76,78, 80, 84.由于,60%分位數為第6和第7個數據的平均值.即.故答案為:75.【變式4-4】(2024·高三·全國·單元測試)某公司對來應聘的人進行筆試,統計出200名應聘者的筆試成績,整理得到下表:組號 1 2 3 4 5 6成績分組累積頻率 0.05 0.15 a注:第n組的累積頻率指的是前n組的頻率之和.若公司計劃150人進入面試,則估計參加面試的最低分數線為 .【答案】65【解析】由各組累積頻率為1得,,則.又由知,面試的最低分數線為筆試成績從低到高排列的第25百分位數,由題表知,筆試成績分別在與的累積頻率分別為,故,解得,從而可估計參加面試的最低分數線為65.故答案為:65題型五:樣本的數字特征【典例5-1】(2024·高三·全國·單元測試)已知一組統計數據的平均數為,方差為,則函數的最小值為 .【答案】【解析】由,得,則,故,當且僅當時等號成立.所以函數的最小值為.故答案為:【典例5-2】(2024·高三·四川樂山·開學考試)已知,,...,的平均數為10,標準差為2,則,,...,的平均數和標準差分別為 和 .【答案】 19 4【解析】∵,,…,的平均數為10,標準差為2,∴,,…,的平均數為:,標準差為:.故答案為:19,4【方法技巧】(1)平均數、中位數、眾數描述其集中趨勢,方差和標準差描述波動大小.(2)方差的簡化計算公式:或寫成,即方差等于原數據平方的平均數減去平均數的平方.【變式5-1】(2024·福建龍巖·三模)互不相等的4個正整數從小到大排序為,若它們的平均數為4,且這4個數據的極差是中位數的2倍,則這4個數據的中位數為 .【答案】/【解析】由題意可知,,,所以,所以,所以,又因為,,,是互不相等的4個正整數從小到大排序的,所以,,或,,,所以這4個數據的中位數為.故答案為:.【變式5-2】(多選題)(2024·江西新余·模擬預測)已知對個數據做如下變換:當為奇數時,對應的變為;當為偶數時,對應的變為,則對于該組數據的變化,下列情況中可能發生的是:( ).A.平均數增大 B.方差不變C.分位數減小 D.眾數減小【答案】BD【解析】由題意易知數據中奇數項均加一,偶數項均減二,則改變后數據和減小,即平均數減小,故A錯誤;由方差的實際意義(數據的波動程度)與在統計圖中幾何特征分析,不妨令:為奇數時,為偶數時,則與方差為,新方差為,兩數據相等,故B正確;易知第分位數為從小到大的第三個數據,而對應的可奇可偶,故C錯誤;不妨取數據:,眾數為1,新數據的偶數項均從1變為,眾數減少,故D正確,故選:BD【變式5-3】(多選題)(2024·湖北·模擬預測)設一組樣本數據滿足,則( )A.拿走,這組數據的方差變大 B.拿走,這組數據的方差變大C.拿走,這組數據的方差減小 D.拿走,這組數據的方差減小【答案】AD【解析】熟知對一組數據,其方差等于各個數據的平方的算術平均值與算術平均值的平方之差,即.將拿走前后的方差分別記為.對于A,給五個元素同時加上或減去同一個數,不影響方差,所以可以適當平移,使得剩下的4個元素:的平均值為0,不妨設,則,,所以.故,所以A正確;對于B,考慮,則,,所以B錯誤;對于C,考慮,則,,所以C錯誤;對于D,由于這組數據不全相等,所以,而,所以D正確.故選:AD.【變式5-4】已知一組數據,,,的方差為4,若數據,,,的方差為36,則b的值為 .【答案】3或【解析】設數據,,,的平均數為,方差為,則,,設數據,,,的平均數為,方差為,則,,所以或,故答案為:3或.【變式5-5】(多選題)一個同學投擲10次骰子,記錄出現的點數,根據統計結果,在下列情況中可能出現點數6的有( )A.平均數為3,中位數為4B.中位數為4,眾數為3C.平均數為2,方差為2.1D.中位數為3,方差為0.85【答案】ABD【解析】對于A:10次點數為符合題意,故A正確;對于B:10次點數為符合題意,故B正確;對于C:設10次點數為且,平均數為,假設有一次點數為,不妨設,由方差公式,代入相關數據得:,即,顯然最大只能取,不妨設得,此時方程無解,所以,當時得:,最大只能取,不妨設得,此時方程有唯一解,,即10次點數為,但此時平均數為不合題意,所以,當得取得,此時方程無解(其余情況也均無解),所以,當時,平均數為不合題意.綜上所述,假設有一次點數為不成立,故C錯誤;對于D:10次點數為符合題意,故D正確.故選:ABD題型六:總體集中趨勢的估計【典例6-1】為了解甲 乙兩種離子在小鼠體內的殘留程度,進行如下試驗:將200只小鼠隨機分成兩組,每組只,其中組小鼠給服甲離子溶液,組小鼠給服乙離子溶液.每只小鼠給服的溶液體積相同 摩爾濃度相同.經過一段時間后用某種科學方法測算出殘留在小鼠體內離子的百分比.根據試驗數據分別得到如下直方圖:記為事件:“乙離子殘留在體內的百分比不高于”,根據直方圖得到的估計值為.(1)求乙離子殘留百分比直方圖中的值;(2)求甲離子殘留百分比的第百分位數;(3)估計乙離子殘留百分比的均值.(同一組數據用該組區間的中點值為代表)【解析】(1)由已知得,解得,所以.(2)根據直方圖,易知甲離子殘留百分比的第百分位數在區間,設為,則,解得,所以甲離子殘留百分比的第百分位數為.(3)乙離子殘留百分比的平均值的估計值為.【典例6-2】某校抽取100名高二學生期中考試的語文成績,繪制頻率分布直方圖(如圖所示),其中樣本數據分組區間為:. (1)求頻率分布直方圖中的值;(2)根據頻率分布直方圖,估計這100名學生語文成績的眾數和平均數.【解析】(1)由頻率分布直方圖知:,解得.(2)由頻率分布直方圖,眾數為:;這100名學生語文成績的平均數為:.【方法技巧】頻率分布直方圖的數字特征(1)眾數:最高矩形的底邊中點的橫坐標.(2)中位數:中位數左邊和右邊的矩形的面積和應該相等.(3)平均數:平均數在頻率分布直方圖中等于各組區間的中點值與對應頻率之積的和.【變式6-1】某校從參加高二年級學業水平測試的學生中抽出80名學生,其數學成績(均為整數,單位:分)的頻率分布直方圖如圖所示. (1)求這次測試數學成績的眾數;(2)求這次測試數學成績的中位數.(3)延伸探究:若本例的條件不變,求數學成績的平均分.(4)若本例條件不變,求80分以下的學生人數.【解析】(1)由題圖知,眾數為分.(2)設中位數為x,由于前三個矩形面積之和為0.4,第四個矩形面積為0.3,,因此中位數位于第四個矩形內,則,解得分.故這次測試數學成績的中位數約為分.(3)數學成績的平均分為分.(4)因為分的頻率為,所以分以下的學生人數為.【變式6-2】為了落實習主席提出“綠水青山就是金山銀山”的環境治理要求.某市政府積極鼓勵居民節約用水.計劃調整居民生活用水收費方案.擬確定一個合理的月用水量標準x(噸).一位居民的月用水量不超過x的部分按平價收費.超出x的部分按議價收費.為了了解居民用水情況.通過抽樣.獲得了某年200位居民每人的月均用水量(單位:噸).將數據按照[0.1).[1.2).….[8.9)分成9組.制成了如圖所示的頻率分布直方圖.其中0.4a=b.(1)求直方圖中a.b的值.并由頻率分布直方圖估計該市居民用水量的眾數;(2)若該市政府希望使85%的居民每月的用水量不超過標準x(噸).估計x的值.【解析】(1)由題意可得 .解得,.由頻率分布直方圖估計該市居民用水量的眾數為噸.(2)因為前6組的頻率和為,前5組的頻率和為.所以,由,解得,所以估計月用水量標準為噸時,的居民每月的用水量不超過標準.題型七:總體離散程度的估計【典例7-1】(2024·全國·模擬預測)某廠為提高工作效率,將全廠分為甲、乙2個車間,每個車間分別設有A,B,C,D,E5組.下表為該廠某日生產訂單情況統計表,請據表解答下列問題:A B C D E甲車間 100 120 150 180 200乙車間 50 120 200 150 180(1)求甲、乙2個車間該日生產訂單的平均數與方差,并根據方差判斷哪一個車間工作效率比較穩定?(2)設甲車間合格率為0.54,乙車間合格率為0.57,求甲、乙2個車間都不合格的概率;(3)你認為哪個車間工作效率更高?請從平均數、方差、合格率的角度分析.【解析】(1)甲車間該日生產訂單的平均數為,乙車間該日生產訂單的平均數為,甲車間該日生產訂單的方差為,乙車間該日生產訂單的方差為,因為甲車間該日生產訂單的方差小于乙車間該日生產訂單的方差,所以甲車間工作效率比較穩定;(2)甲、乙2個車間都不合格的概率為;(3)平均數上甲車間的該日生產訂單更大,方差更小,乙車間合格率更大,但是差別并不大,所以甲車間工作效率更高.【典例7-2】某校高一(1)班、(2)班的學生人數分別為40,42,在某次測驗中,記(1)班所有學生的成績分別為,,…,,平均成績為,方差為,已知,.(1)求,;(2)記(2)班所有學生的成績分別為,,…,,其平均成績為82,,試求兩個班的所有學生的平均成績(結果保留整數),并說明哪一個班的成績比較穩定.【解析】(1)由題意知,得,.(2)記(2)班的平均成績為,方差為,則,所以,所以兩個班所有學生的平均成績為,,因為,所以(1)班的成績比較穩定.【方法技巧】總體離散程度的估計標準差(方差)反映了數據的離散與集中、波動與穩定的程度.標準差(方差)越大,數據的離散程度越大;標準差(方差)越小,數據的離散程度越小.【變式7-1】在2024年世界泳聯跳水世界杯蒙特利爾站和柏林站女子10米臺跳水決賽中,全紅嬋奉獻了高水準的精彩表現,在決賽中的五個動作驚艷了全世界.在這兩場決賽中,7名裁判給選手的五個跳水動作打分,兩站裁判對全紅嬋的打分記錄如下:(為了方便計算,采取分數四舍五入取整)A組(蒙特利爾站):80 80 82 78 93B組(柏林站):81 80 86 99 86(1)請寫出這10個分數的眾數、極差以及A,B兩組各自的平均成績;(2)請你根據所學的統計知識,分析兩站比賽中,哪一站全紅嬋發揮更穩定?并說明理由.【解析】(1)易知在這10個分數中,出現最多的是80,所以眾數為80,這10個分數中,最高分為99,最低分為78,所以極差為,A,B兩組各自的平均成績分別為,(2)可以用方差來衡量,方差越小,分數越集中,判斷發揮越穩定,設蒙特利爾站和柏林站的方差分別為,,易知,,因為,所以蒙特利爾站發揮更穩定.【變式7-2】(2024·云南昆明·三模)甲、乙兩位同學組成學習小組進行項目式互助學習,在共同完成某個內容的互助學習后,甲、乙都參加了若干次測試,現從甲的測試成績里隨機抽取了7次成績,從乙的測試成績里隨機抽取了9次成績,數據如下:甲:93 95 81 72 80 82 92乙:85 82 77 80 94 86 92 84 85經計算得出甲、乙兩人的測試成績的平均數均為85.(1)求甲乙兩位同學測試成績的方差;(2)為檢驗兩組數據的差異性是否顯著,可以計算統計量,其中個數據的方差為,個數據的方差為,且.若,則認為兩組數據有顯著性差異,否則不能認為兩組數據有顯著性差異.若的臨界值采用下表中的數據:1 2 3 4 5 6 7 81 161 200 216 225 230 234 237 2392 18.5 19.0 19.2 19.2 19.3 19.3 19.4 19.43 10.1 9.55 9.28 9.12 9.01 8.94 8.89 8.854 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.045 6.61 5.79 5.41 6.19 5.05 4.95 4.88 4.826 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.157 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.738 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44例如:對應的臨界值為5.41.請根據以上資料判斷甲、乙兩位同學進行項目式互助學習的效果是否有顯著性差異.【解析】(1)依題意:,,所以,,.(2)由于,則,,,,則,查表得對應的臨界值為3.58,則,所以甲、乙兩位同學進行項目式互助學習的效果沒有顯著性差異.【變式7-3】(2024·寧夏銀川·一模)濱海鹽堿地是我國鹽堿地的主要類型之一,如何利用更有效的方法改造這些寶貴的土地資源,成為擺在我們面前的世界級難題.對鹽堿的治理方法,研究人員在長期的實踐中獲得了兩種成本差異不大,且能降低濱海鹽堿地土壤層可溶性鹽含量的技術,為了對比兩種技術治理鹽堿的效果,科研人員在同一區域采集了12個土壤樣本,平均分成A、B兩組,測得A組土壤可溶性鹽含量數據樣本平均數,方差,B組土壤可溶性鹽含量數據樣本平均數,方差.用技術1對A組土壤進行可溶性鹽改良試驗,用技術2對B組土壤進行可溶性鹽改良試驗,分別獲得改良后土壤可溶性鹽含量數據如下:A組 0.66 0.68 0.69 0.71 0.72 0.74B組 0.46 0.48 0.49 0.49 0.51 0.54改良后A組、B組土壤可溶性鹽含量數據樣本平均數分別為和,樣本方差分別記為和.(1)求;(2)應用技術1與技術2土壤可溶性鹽改良試驗后,土壤可溶性鹽含量是否有顯著降低?(若,則認為技術能顯著降低土壤可溶性鹽含量,否則不認為有顯著降低.)【解析】(1), (2)當時,,,應用技術1后,土壤可溶性鹽含量沒有顯著降低當時,,,∴應用技術2后,土壤可溶性鹽含量沒有顯著降低.故應用技術1和技術2后,土壤可溶性鹽含量沒有顯著降低.【變式7-4】(2024·高三·青海西寧·開學考試)某新能源汽車配件廠生產一種新能源汽車精密零件,為提高產品質量引入了一套新生產線,為檢驗新生產線所生產出來的零件質量有無顯著提高,現同時用舊生產線和新生產線各生產了10個零件,得到各個零件的質量指標的數據如下:舊生產線 5.2 4.8 4.8 5.0 5.0 5.2 5.1 4.8 5.1 5.0新生產線 5.0 5.2 5.3 5.1 5.4 5.2 5.2 5.3 5.2 5.1設舊生產線和新生產線所生產零件的質量指標的樣本平均數分別為和,樣本方差分別為和.(1)求,及;(2)若,則認為新生產線生產零件的質量有顯著提高,否則不認為有顯著提高,現計算得,試判斷新生產線生產的零件質量較舊生產線生產的零件質量是否有顯著提高.【解析】(1)由題意得,,;(2)由(1)可得,,因為,所以,故新生產線生產的零件質量較舊生產線生產的零件質量有顯著提高.【變式7-5】(2024·高三·黑龍江雞西·期末)為了了解甲、乙兩個工廠生產的輪胎的寬度是否達標,分別從兩廠隨機選取了10個輪胎,將每個輪胎的寬度(單位:)記錄下來并繪制出折線圖:(1)分別計算甲、乙兩廠提供10個輪胎寬度的平均值;(2)輪胎的寬度在內,則稱這個輪胎是標準輪胎.試比較甲、乙兩廠分別提供的10個輪胎中所有標準輪胎寬度的方差的大小,根據兩廠的標準輪胎寬度的平均水平及其波動情況,判斷這兩個工廠哪個廠的輪胎相對更好 【解析】(1)記甲廠提供的個輪胎寬度的平均值為,乙廠提供的個輪胎寬度的平均值為,,.(2)甲廠個輪胎寬度在內的數據為,則平均數為,所以方差;乙廠個輪胎寬度在內的數據為,則平均數為,所以方差;因為甲、乙兩廠生產的標準輪胎寬度的平均值一樣,但乙廠的方差更小,所有乙廠的輪胎相對更好.題型八:分層方差問題【典例8-1】(2024·廣東珠海·一模)甲、乙兩班參加了同一學科的考試,其中甲班50人,乙班40人.甲班的平均成績為72分,方差為90分;乙班的平均成績為90分,方差為60分.那么甲、乙兩班全部90名學生的平均成績是 分,方差是 分.【答案】 80【解析】甲、乙兩班全部90名學生的平均成績為分,方差為故答案為:80,【典例8-2】(2024·山西太原·二模)為獲得某校高一年級全體學生的身高信息,現采用樣本量按比例分配的分層隨機抽樣方法抽取了一個樣本,其中有30名男生和20名女生,計算得男生樣本的均值為170,方差為15.女生樣本的均值為160,方差為30,則由上述數據計算該校高一年級學生身高的均值是 ,方差是 .【答案】 166 45【解析】設樣本中男生的身高為,女生的身高為,則,該校高一年級學生身高的均值是,方差為.故答案為:166,45.【方法技巧】分層隨機抽樣的方差設樣本容量為,平均數為,其中兩層的個體數量分別為,兩層的平均數分別為,,方差分別為,則這個樣本的方差為【變式8-1】為培養學生的閱讀習慣,某校開展了為期一年的“弘揚傳統文化,閱讀經典名著”活動.在了解全校學生每年平均閱讀了多少本文學經典名著時,甲同學抽取了一個容量為10的樣本,并算得樣本的平均數為5,方差為9;乙同學抽取了一個容量為8的樣本,并算得樣本的平均數為6,方差為16.已知甲、乙兩同學抽取的樣本合在一起組成一個容量為18的樣本,則合在一起后的樣本平均數為 ,方差為 .(精確到0.1)【答案】 5.4 12.4【解析】把甲同學抽取的樣本的平均數記為,方差記為;把乙同學抽取的樣本的平均數記為,方差記為;把合在一起后的樣本的平均數記為,方差記為.則,.即合在一起后樣本的平均數為5.4,方差為12.4.故答案為:5.4;12.4【變式8-2】(2024·高三·四川·期末)某校有3名百米短跑運動員甲、乙、丙,已知甲最近10次百米短跑的時間(單位:s)的數據如下表:第1次 第2次 第3次 第4次 第5次 第6次 第7次 第8次 第9次 第10次時間/s 12 12.4 12 12.5 12 11.8 12.2 11.5 11.6 12(1)計算甲這10次百米短跑的時間的平均數與方差;(2)經過計算,乙最近10次百米短跑的時間的平均數和方差分別為12,0.08,丙最近10次百米短跑的時間的平均數和方差分別為12.4,0.08,若要從甲、乙、丙三人中選一人代表學校參加市區的百米短跑比賽,請判斷該選擇誰,說明你的理由.【解析】(1)甲這10次百米短跑的時間的平均數為,方差為.(2)因為百米短跑的時間越短,成績越好,所以從數據的平均水平看,甲與乙的成績更好.因為方差越大,數據的波動越大,方差越小,數據的波動越小,所以從數據的波動情況看,甲的成績波動最大,乙和丙的波動水平相當,所以應該選乙參加市區的百米短跑比賽.【變式8-3】某地區有小學生9000人,初中生8600人,高中生4400人,教育局組織網絡“防溺水”網絡知識問答,現用分層抽樣的方法從中抽取220名學生,對其成績進行統計分析,得到如下圖所示的頻率分布直方圖所示的頻率分布直方圖.(1)根據頻率分布直方圖,估計該地區所有學生中知識問答成績的平均數和眾數;(2)成績位列前10%的學生平臺會生成“防溺水達人”優秀證書,試估計獲得“防溺水達人”的成績至少為多少分;(3)已知落在內的平均成績為67,方差是9,落在內的平均成績是73,方差是29,求落在內的平均成績和方差.(附:設兩組數據的樣本量 樣本平均數和樣本方差分別為:.記兩組數據總體的樣本平均數為,則總體樣本方差)【解析】(1)一至六組的頻率分別為,平均數.由圖可知,眾數為.以樣本估計總體,該地區所有學生中知識問答成績的平均數為分,眾數為分.(2)前4組的頻率之和為,前5組的頻率之和為,第分位數落在第5組,設為x,則,解得.“防溺水達人”的成績至少為分.(3))的頻率為,)的頻率為,所以的頻率與的頻率之比為的頻率與的頻率之比為設內的平均成績和方差分別為,依題意有,解得,解得,所以內的平均成績為,方差為.【變式8-4】某校高一年級有男生200人,女生100人.為了解該校全體高一學生的身高信息,按性別比例進行分層隨機抽樣,抽取總樣本為30的樣本,并觀測樣本的指標價(單位:cm),計算得男生樣本的身高平均數為169,方差為39.下表是抽取的女生樣本的數據;抽取次序 1 2 3 4 5 6 7 8 9 10身高 155 158 156 157 160 161 159 162 169 163記抽取的第i個女生的身高為(,2,3,…,10),樣本平均數,方差.參考數據:,,.(1)若用女生樣本的身高頻率分布情況代替該校高一女生總體的身高頻率分布情況,試估計該校高一女生身高在范圍內的人數;(2)用總樣本的平均數和標準差分別估計該校高一學生總體身高的平均數和標準差,求,的值;(3)如果女生樣本數據在之外的數據稱為離群值,試剔除離群值后,計算剩余女生樣本身高的平均數與方差.【解析】(1)因女生樣本中,身高在范圍內的占比為,故該校高一女生身高在范圍內的人數估計為;(2)記總樣本的平均數為,標準差為,由題意,設男生樣本(20人)的身高平均數為,方差為,女生樣本(10人)的身高平均數為,方差,則,,故;(3)因,,則,即,約為,由樣本數據知,,為離群值,剔除169后,女生樣本(9人)的身高平均數為:;由可得,,則剔除169后,女生樣本(9人)的身高的方差為:.【變式8-5】2023年10月26日,中國的神舟十七號載人飛船與“天宮”空間站成功對接,形成三艙三船組合體.某地區為了激發當地人民對天文學的興趣,開展了天文知識比賽,滿分100分(95分及以上為認知程度高),結果認知程度高的有人,這人按年齡分成5組,其中第一組:,第二組:,第三組:,第四組:,第五組:,得到如圖所示的頻率分布直方圖.已知第一組有10人. (1)根據頻率分布直方圖,估計這人的第60百分位數(精確到0.1);(2)現從第四組和第五組用分層隨機抽樣的方法抽取6人,擔任“黨章黨史”宣傳使者.①有甲(年齡36),乙(年齡42),且甲、乙確定入選,從6人中要選擇兩個人擔任組長,求甲、乙兩人至少有一人被選上組長的概率;②若第四組宣傳使者的年齡的平均數與方差分別為36和,第五組宣傳使者的年齡的平均數與方差分別為42和1,估計這人中35-45歲所有人年齡的平均數和方差.【解析】(1)設第60百分位數為,因為,,所以位于第三組:內,所以.(2)①由題意得,第四組和第五組抽取人數之比為,即第四組4人,記為A,B,C,甲,第五組2,記為D,乙,對應的樣本空間為:AB,AC,A甲,AD,A乙,BC,B甲,BD,B乙,C甲, CD,C乙,甲D,甲乙,D乙,共15個樣本點,設事件M為“甲、乙兩人至少一人被選上”,則有A甲,A乙,B甲,B乙,C甲,C乙,甲D,甲乙,D乙,共有9個樣本點.所以;②設第四組的宣傳使者的年齡平均數分為,方差為,設第五組的宣傳使者的年齡平均數為,方差為,第四組和第五組所有宣傳使者的年齡平均數為,方差為,則 即第四組和第五組所有宣傳使者的年齡平均數為,,即第四組和第五組所有宣傳使者的年齡方差為.據此估計這人中年齡在35~45歲的所有人的年齡的平均數為38,方差約為10.【變式8-6】為進一步推動防范電信網絡詐騙工作,預防和減少電信網絡詐騙案件的發生,某市開展防騙知識大宣傳活動.舉辦了“網絡防騙”知識競賽,從所有答卷中隨機抽取100份作為樣本,將樣本的成績(滿分100分,成績均為不低于40分的整數)分成六段:,,…,得到如圖所示的頻率分布直方圖.(1)求圖中的值,根據頻率分布直方圖計算樣本成績的平均數和下四分位數;(2)已知若總體劃分為2層,通過分層隨機抽樣,各層抽取的樣本量、樣本平均數和樣本方差分別為:,,;,,,記總的樣本平均數為,樣本方差為.證明:;(3)已知落在的平均成績是59,方差是7,落在的平均成績為65,方差是4,求兩組樣本成績的總平均數和總方差.【解析】(1)由題意可知,,解得:;平均數為,前2組的頻率和為,前3組的頻率和為,所以下四分位數在第3組,設為,則,得所以下四分位數為;(2),,,總體方差,又,,,因為,,,同理,故,;(3)的頻率是,頻數是,的頻率是,頻數是所以總體平均數,總體方差.1.(多選題)(2023年新課標全國Ⅰ卷數學真題)有一組樣本數據,其中是最小值,是最大值,則( )A.的平均數等于的平均數B.的中位數等于的中位數C.的標準差不小于的標準差D.的極差不大于的極差【答案】BD【解析】對于選項A:設的平均數為,的平均數為,則,因為沒有確定的大小關系,所以無法判斷的大小,例如:,可得;例如,可得;例如,可得;故A錯誤;對于選項B:不妨設,可知的中位數等于的中位數均為,故B正確;對于選項C:因為是最小值,是最大值,則的波動性不大于的波動性,即的標準差不大于的標準差,例如:,則平均數,標準差,,則平均數,標準差,顯然,即;故C錯誤;對于選項D:不妨設,則,當且僅當時,等號成立,故D正確;故選:BD.2.(多選題)(2021年全國新高考II卷數學試題)下列統計量中,能度量樣本的離散程度的是( )A.樣本的標準差 B.樣本的中位數C.樣本的極差 D.樣本的平均數【答案】AC【解析】由標準差的定義可知,標準差考查的是數據的離散程度;由中位數的定義可知,中位數考查的是數據的集中趨勢;由極差的定義可知,極差考查的是數據的離散程度;由平均數的定義可知,平均數考查的是數據的集中趨勢;故選:AC.3.(多選題)(2021年全國新高考I卷數學試題)有一組樣本數據,,…,,由這組數據得到新樣本數據,,…,,其中(為非零常數,則( )A.兩組樣本數據的樣本平均數相同B.兩組樣本數據的樣本中位數相同C.兩組樣本數據的樣本標準差相同D.兩組樣本數據的樣本極差相同【答案】CD【解析】A:且,故平均數不相同,錯誤;B:若第一組中位數為,則第二組的中位數為,顯然不相同,錯誤;C:,故方差相同,正確;D:由極差的定義知:若第一組的極差為,則第二組的極差為,故極差相同,正確;故選:CD4.(2021年天津高考數學試題)從某網絡平臺推薦的影視作品中抽取部,統計其評分數據,將所得個評分數據分為組:、、、,并整理得到如下的頻率分布直方圖,則評分在區間內的影視作品數量是( )A. B. C. D.【答案】D【解析】由頻率分布直方圖可知,評分在區間內的影視作品數量為.故選:D.5.(2021年全國高考甲卷數學(理)試題)為了解某地農村經濟情況,對該地農戶家庭年收入進行抽樣調查,將農戶家庭年收入的調查數據整理得到如下頻率分布直方圖:根據此頻率分布直方圖,下面結論中不正確的是( )A.該地農戶家庭年收入低于4.5萬元的農戶比率估計為6%B.該地農戶家庭年收入不低于10.5萬元的農戶比率估計為10%C.估計該地農戶家庭年收入的平均值不超過6.5萬元D.估計該地有一半以上的農戶,其家庭年收入介于4.5萬元至8.5萬元之間【答案】C【解析】因為頻率直方圖中的組距為1,所以各組的直方圖的高度等于頻率.樣本頻率直方圖中的頻率即可作為總體的相應比率的估計值.該地農戶家庭年收入低于4.5萬元的農戶的比率估計值為,故A正確;該地農戶家庭年收入不低于10.5萬元的農戶比率估計值為,故B正確;該地農戶家庭年收入介于4.5萬元至8.5萬元之間的比例估計值為,故D正確;該地農戶家庭年收入的平均值的估計值為(萬元),超過6.5萬元,故C錯誤.綜上,給出結論中不正確的是C.故選:C.1.某校舉行演講比賽,10位評委對兩位選手的評分如下:甲 7.5 7.5 7.8 7.8 8.0 8.0 8.2 8.3 8.4 9.9乙7.5 7.8 7.8 7.8 8.0 8.0 8.3 8.3 8.5 8.5選手的最終得分為去掉一個最低分和一個最高分之后,剩下8個評分的平均數.那么,這兩個選手的最后得分是多少?若直接用10位評委評分的平均數作為選手的得分,兩位選手的排名有變化嗎?你認為哪種評分辦法更好?為什么?【解析】甲選手的最后得分為.乙選手的最后得分為.若直接用10位評委評分的平均數作為選手的得分,則甲選手的得分為.乙選手的得分為.去掉最高分與最低分時,甲的得分小于乙的得分,即乙的排名靠前;若直接用評委評分的平均數作為得分,則甲的得分大于乙的得分,即甲的排名靠前,兩種評分下,甲、乙兩位選手的排名變化大,去掉一個最低分和一個最高分之后,剩下8個評分的平均數作為選手的最后得分更好,這是因為平均數對樣本數據的極端值比較“敏感”.2.某小區廣場上有甲、乙兩群市民正在進行晨練,兩群市民的年齡如下(單位:歲):甲群:13,13,14,15,15,15,15,16,17,17.乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年齡的平均數、中位數和眾數各是多少歲?其中哪個統計量能較好地反映甲群市民的年齡特征?(2)乙群市民年齡的平均數、中位數和眾數各是多少歲?其中哪個統計量能較好地反映乙群市民的年齡特征?【解析】(1)甲群市民年齡的平均數為(歲),中位數為15歲,眾數為15歲.平均數、中位數和眾數相等,因此它們都能較好地反映甲群市民的年齡特征.(2)乙群市民年齡的平均數為(歲),中位數為6歲,眾數為6歲由于乙群市民大多數是兒童,所以中位數和眾數能較好地反映乙群市民的年齡特征,而平均數的可靠性較差.3.某班4個小組的人數為10,10,x,8,已知該組數據的中位數與平均數相等,求這組數據的中位數.【解析】該組數據的平均數為,中位數一定是其中兩個數的平均數,由于x不知是多少,所以要分情況討論.(1)當時,原數據按從小到大的順序排列為x,8,10,10,中位數為.故,則,此時中位數為9.(2)當時,原數據按從小到大的順序排列為8,x,10,10,中位數為;,故,則,而8不在的范圍內,所以舍去.(3)當時,原數據按從小到大的順序排列為8,10,10,x,中位數為.故,則,此時中位數為10.綜上所述,這組數據的中位數為9或10.4.數據的方差和標準差分別為.數據的方差和標準差分別為,若成立,a,b為常數,證明.【解析】證明:設數據的平均數,數據的平均數為,則.,.5.數據的方差,證明:所有的都相同.【解析】證明:設的平均數為,則.,,,∴所有的都相同.6.已知總體劃分為3層,通過分層隨機抽樣,各層抽取的樣本量、樣本平均數和樣本方差分別為:.記總的樣本平均數為,樣本方差為.證明:(1);【答案】 100【解析】在頻數分布直方圖中,每組長方形的高度表示頻數,因此各組長方形高度之和為;在頻率分布直方圖中,每組長方形的高度表示頻率/組距,因此各組長方形高度之和為總頻率/組距,即.故答案為:100,0.2【易錯題2】某大學有男生名.為了解該校男生的身體體重情況,隨機抽查了該校名男生的體重,并將這名男生的體重(單位:)分成以下六組:、、、、、,繪制成如下的頻率分布直方圖:該校體重(單位:)在區間上的男生大約有 人.【答案】【解析】由頻率分布直方圖可知,該校體重(單位:)在區間上的男生的人數為.故答案為:.答題模板:求百分位數1、模板解決思路解決本模板問題要理解百分位數的定義,嚴格按照百分位數的計算步驟求解.2、模板解決步驟第一步:按從小到大排列原始數據.第二步:計算.第三步:若不是整數而大于的比鄰整數,則第百分位數為第項數據;若是整數,則第百分位數為第項與第項數據的平均數.【經典例題1】現有一組數據按照從小到大的順序排列如下:4,6,7,7,8,9,11,14,15,19,則這組數據的上四分位數為 .【答案】【解析】因為,所以這組數據的上四分位數為.故答案為:【經典例題2】某機構研究得出10名肺炎病患者的潛伏期(單位:天)分別為8,12,11,7,9,17,14,13,12,15,則這10個數據的第70百分位數是 .【答案】13.5/【解析】將這10個數據從小到大排列得7,8,9,11,12,12,13,14,15,17,又,故第70百分位數是.故答案為:13.521世紀教育網(www.21cnjy.com) 展開更多...... 收起↑ 資源列表 2025年新高考數學一輪復習第9章第01講隨機抽樣、統計圖表、用樣本估計總體(八大題型)(講義)(學生版).docx 2025年新高考數學一輪復習第9章第01講隨機抽樣、統計圖表、用樣本估計總體(八大題型)(講義)(教師版).docx 縮略圖、資源來源于二一教育資源庫