資源簡介 (共72張PPT)微專題12 統(tǒng)計與成對數(shù)據(jù)的統(tǒng)計分析2025 高考第二輪專題 數(shù)學微點1 眾數(shù)、中位數(shù)、平均數(shù)、百分位數(shù)例1(1)(多選題)[2024·長沙一中模擬] 為分析甲班學生某次數(shù)學測試的情況,采用男生、女生比例分配的分層隨機抽樣的方法抽取樣本,該樣本中男生的成績?yōu)椋?,女生的成績?yōu)?br/>,,,, ,下列說法正確的是( )A.若樣本中男、女生兩組成績的平均數(shù)都為,則樣本的平均數(shù)等于B.若樣本中男、女生兩組成績的中位數(shù)都為,則樣本的中位數(shù)等于C.若樣本中男、女生兩組成績的第40百分位數(shù)都為 ,則樣本的第40百分位數(shù)可能大于D.若樣本中男、女生兩組成績的方差都為 ,則樣本的方差一定不小于√√√[解析] 設, ,所有樣本數(shù)據(jù)按照從小到大排列為,, , .對于A,因為 ,所以A正確.對于B,因為,所以,所以樣本的中位數(shù)為 ,所以B正確.對于C,,若,則 ,所以,分別為和;若,則,所以,分別為 和.兩種情況下,樣本的第40百分位數(shù)均等于 ,所以C錯誤.對于D,方法一:根據(jù)比例分配的分層隨機抽樣的方差公式,設樣本方差為,平均數(shù)為 ,則 ,所以樣本的方差一定不小于 ,所以D正確.方法二:因為,所以 ,,,所以樣本的方差為 ,因為 ,所以樣本的方差一定不小于,所以D正確.故選 .(2)[2024· 新課標Ⅱ卷]某農(nóng)業(yè)研究部門在面積相等的100塊稻田上種植一種新型水稻,得到各塊稻田的畝產(chǎn)量(單位: )都在內(nèi),并整理得到下表:畝產(chǎn)量頻數(shù) 6 12 18 30 24 10根據(jù)表中數(shù)據(jù),下列結論正確的是( )A.100塊稻田畝產(chǎn)量的中位數(shù)小于B.100塊稻田中畝產(chǎn)量低于的稻田所占比例超過C.100塊稻田畝產(chǎn)量的極差介于到 之間D.100塊稻田畝產(chǎn)量的平均值介于到 之間√[解析] 對于A,根據(jù)頻數(shù)分布表可知, ,所以畝產(chǎn)量的中位數(shù)不小于 ,故A錯誤;對于B,畝產(chǎn)量低于的稻田所占比例為 ,故B錯誤;對于C,設稻田畝產(chǎn)量的極差為,則由題意知 ,且,即 ,故C正確;對于D,100塊稻田畝產(chǎn)量的平均值為 ,故D錯誤.故選C.自測題1.(多選題)[2024·武漢調(diào)研] 如圖所示,下列頻率分布直方圖顯示了三種不同的分布形態(tài).圖①形成對稱形態(tài),圖②形成“右拖尾”形態(tài),圖③形成“左拖尾”形態(tài),下列判斷正確的是( )A.圖①的平均數(shù)中位數(shù) 眾數(shù) B.圖②的平均數(shù) 眾數(shù) 中位數(shù)C.圖②的眾數(shù) 中位數(shù) 平均數(shù) D.圖③的平均數(shù) 中位數(shù) 眾數(shù)√√√[解析] 圖①的頻率分布直方圖是對稱的,所以平均數(shù)中位數(shù) 眾數(shù),故A正確;圖②的眾數(shù)最小,且“右拖尾”時平均數(shù)大于中位數(shù),故B錯誤,C正確;圖③的眾數(shù)最大,且“左拖尾”時平均數(shù)小于中位數(shù),故D正確.故選 .2.(多選題)[2024·遼寧撫順六校聯(lián)考]2023年7月31日國家統(tǒng)計局發(fā)布了制造業(yè)采購經(jīng)理指數(shù) ,如圖所示:下列說法正確的是( )A.從2023年1月到2023年7月,這7個月的制造業(yè)采購經(jīng)理指數(shù) 的第75百分位數(shù)為B.從2023年1月到2023年7月,這7個月的制造業(yè)采購經(jīng)理指數(shù) 的極差為C.從2022年7月到2023年7月,制造業(yè)采購經(jīng)理指數(shù) 呈下降趨勢D.若大于 表示經(jīng)濟處于擴張活躍的狀態(tài),小于 表示經(jīng)濟處于低迷萎縮的狀態(tài),則2023年1月到2023年3月,經(jīng)濟處于擴張活躍的狀態(tài)√√√[解析] 由圖知,從2023年1月到2023年7月,這7個月的制造業(yè)采購經(jīng)理指數(shù) 從小到大的順序為,, , ,,, ,因為 ,所以第75百分位數(shù)為第 6個數(shù),即為 ,故A正確;從2023年1月到2023年7月,這7個月的制造業(yè)采購經(jīng)理指數(shù)的最大值為,最小值為 ,所以極差為 ,故B正確;由圖易知,從2022年7月到2023年7月,制造業(yè)采購經(jīng)理指數(shù) 有升有降,故C錯誤;由圖知2023年1月到2023年3月的均大于 ,所以經(jīng)濟處于擴張活躍的狀態(tài), 故D正確.故選 .微點2 回歸模型例2 [2024·泉州模擬] 某公司為了解年研發(fā)資金 (單位:億元)對年產(chǎn)值(單位:億元)的影響,對公司近8年的年研發(fā)資金 和年產(chǎn)值 的數(shù)據(jù)進行分析,選用了兩個回歸模型,并利用最小二乘法求得相應的關于 的經(jīng)驗回歸方程:; .參考數(shù)據(jù):,, ,.(1)求 的值;解:根據(jù)題意,令,則 ,, ,將點的坐標代入方程 ,得,解得 ,所以的值為 .(2)已知①中的殘差平方和 ,②中的殘差平方和,請根據(jù)決定系數(shù)選擇擬合效果更好的經(jīng)驗回歸方程,并利用該經(jīng)驗回歸方程預測年研發(fā)資金為20億元時的年產(chǎn)值.參考公式:刻畫回歸模型擬合效果的決定系數(shù) .解:設經(jīng)驗回歸方程①的決定系數(shù)為,由 ,得 .設經(jīng)驗回歸方程②的決定系數(shù)為 ,由,得 .因為 ,所以經(jīng)驗回歸方程②的擬合效果更好.當時, ,所以預測年研發(fā)資金為20億元時的年產(chǎn)值為295.02億元.【規(guī)律提煉】1.(1)正確理解計算,的公式和準確地計算是求經(jīng)驗回歸方程的關鍵;(2)經(jīng)驗回歸直線必過點.2.(1)在分析兩個變量的相關關系時,可根據(jù)樣本數(shù)據(jù)作出散點圖來判斷兩個變量之間是否具有線性相關關系,若具有線性相關關系,則可通過經(jīng)驗回歸方程來估計和預測;(2)對于非線性回歸分析問題,應先進行變量代換,求出代換后的經(jīng)驗回歸方程,再求非線性經(jīng)驗回歸方程.自測題[2024·鄭州三模] 按照《中華人民共和國環(huán)境保護法》的規(guī)定,每年生態(tài)環(huán)境部都會會同國家發(fā)展改革委等部門共同編制《中國生態(tài)環(huán)境狀況公報》,并向社會公開發(fā)布.下表是 年五年《中國生態(tài)環(huán)境狀況公報》中酸雨區(qū)面積約占國土面積的百分比 :年份 2017年 2018年 2019年 2020年 2021年年份代碼 1 2 3 4 56.4 5.5 5.0 4.8 3.8(1)求與的樣本相關系數(shù)(精確到 );附:, ,樣本相關系數(shù), .解:由題意可得,, ,由題可列下表:0 1 21.3 0.4可得, ,,故樣本相關系數(shù).(2)請用樣本相關系數(shù)說明該組數(shù)據(jù)中與 之間的關系可用一元線性回歸模型進行擬合,并求出關于 的經(jīng)驗回歸方程;經(jīng)驗回歸直線的斜率和截距的最小二乘估計公式分別為, .附:, ,樣本相關系數(shù), .解:由(1)知,與的樣本相關系數(shù),接近1,所以 與 之間具有較強的線性相關關系,可用一元線性回歸模型進行擬合.由(1)知, ,,所以關于 的經(jīng)驗回歸方程為 .(3)預測2025年的酸雨區(qū)面積占國土面積的百分比.解:當時, ,故預測2025年的酸雨區(qū)面積占國土面積的百分比為 .微點3 獨立性檢驗例3 [2024·齊魯名校聯(lián)盟聯(lián)考] 某汽車文化自媒體公司主打?qū)υ揭败?br/>越野能力的測評,為調(diào)查車友們對越野車的了解程度,隨機抽取了200名車友進行調(diào)查,得到如下表的數(shù)據(jù):單位:人對越野車的了解程度 性別 合計女 男 比較了解 78不太了解 38合計 140 200(1)完成上面的列聯(lián)表,根據(jù)小概率值 的獨立性檢驗,能否認為車友對越野車的了解程度與性別有關聯(lián)?附: .0.05 0.01 0.0053.841 6.635 7.879解:補充完整的 列聯(lián)表如下:單位:人對越野車的了解程度 性別 合計女 男 比較了解 22 78 100不太了解 38 62 100合計 60 140 200零假設為 車友對越野車的了解程度與性別無關聯(lián).根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計算得,所以根據(jù)小概率值的獨立性檢驗,推斷 不成立,即認為車友對越野車的了解程度與性別有關聯(lián).(2)該公司組織5名駕駛水平相當?shù)膯T工在戶外場地進行汽車越野活動,他們需要合作闖關,一共有兩關,每次由一名員工上場,闖過第一關才能繼續(xù)闖第二關,若闖某一關失敗,則換下一名員工從失敗的這一關開始闖,同一員工不重復上場,當有人闖過第二關時或者5名員工都闖關失敗時活動結束.若無論前面的闖關結果如何,每名員工闖過第一關的概率都為,闖過第二關的概率都為 ,求第三名員工闖關后活動恰好結束的概率.解:第三名員工闖關后活動恰好結束分以下幾種情況:①前兩名員工未過第一關,第三名員工闖過第一、二關,其概率 ;②第一名員工未過第一關,第二名員工過第一關未過第二關,第三名員工過第二關,其概率 ;③第一名員工過第一關未過第二關,第二名員工未過第二關,第三名員工過第二關,其概率 .所以第三名員工闖關后活動恰好結束的概率.自測題(多選題)某校為了解高一新生對數(shù)學是否感興趣,從400名女生和600名男生中采用比例分配的分層隨機抽樣的方式抽取100名學生進行問卷調(diào)查,根據(jù)調(diào)查的結果得到如下等高堆積條形圖和列聯(lián)表,則( )單位:人性別 是否對數(shù)學感興趣 合計感興趣 不感興趣 女男合計 100附:, .0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828A.表中,B.可以估計該校高一新生中對數(shù)學不感興趣的女生人數(shù)比男生多C.根據(jù)小概率值 的獨立性檢驗,可以認為是否對數(shù)學感興趣與性別有關聯(lián)D.根據(jù)小概率值 的獨立性檢驗,可以認為是否對數(shù)學感興趣與性別沒有關聯(lián)√√√[解析] 由題可知,抽取男生的人數(shù)為 ,抽取女生的人數(shù)為 ,由等高堆積條形圖知,抽取的男生中對數(shù)學感興趣的人數(shù)為 ,抽取的男生中對數(shù)學不感興趣的人數(shù)為 ,抽取的女生中對數(shù)學感興趣的人數(shù)為 ,抽取的女生中對數(shù)學不感興趣的人數(shù)為,列聯(lián)表如下.性別 是否對數(shù)學感興趣 合計感興趣 不感興趣 女 12 28 40男 30 30 60合計 42 58 100由此表可知,, ,故A正確;估計該校高一新生中女生對數(shù)學不感興趣的人數(shù)為 ,男生對數(shù)學不感興趣的人數(shù)為 ,所以估計該校高一新生中對數(shù)學不感興趣的女生人數(shù)比男生少,故B錯誤;單位:人零假設為 是否對數(shù)學感興趣 與性別無關聯(lián),根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計算得到 ,根據(jù)小概率值的獨立性檢驗,有充分證據(jù)推斷 不成立,即認為是否對數(shù)學感興趣與性別有關聯(lián),故C正確;,根據(jù)小概率值的獨立性檢驗,沒有充分證據(jù)推斷 不成立,因此可以認為 成立,即認為是否對數(shù)學感興趣與性別沒有關聯(lián),故D正確.故選 .1.[2020·全國卷Ⅰ]某校一個課外學習小組為研究某作物種子的發(fā)芽率和溫度(單位: )的關系,在20個不同的溫度條件下進行種子發(fā)芽實驗,由實驗數(shù)據(jù) 得到如圖所示的散點圖:A. B.C. D.[解析] 由散點圖可知回歸方程的類型為對數(shù)型,故選D.√由此散點圖,在至 之間,下面四個回歸方程類型中最適宜作為發(fā)芽率和溫度 的回歸方程類型的是( )2.[2022·天津卷]為研究某藥品的療效,選取若干名志愿者進行臨床試驗,所有志愿者的舒張壓數(shù)據(jù)(單位: )的分組區(qū)間為,, ,A.8 B.12 C.16 D.18將其按從左到右的順序分別編號為第一組、第二組、第三組、第四組、第五組,如圖是根據(jù)試驗數(shù)據(jù)制成的頻率分布直方圖.已知第一組與第二組共有20人,第三組中沒有療效的有6人,則第三組中有療效的人數(shù)為( )√[解析] 志愿者的總?cè)藬?shù)為, 第三組的人數(shù)為,故第三組中有療效的人數(shù)為 .故選B.3.(多選題)[2023· 新課標Ⅰ卷] 有一組樣本數(shù)據(jù),, , ,其中是最小值, 是最大值,則( )A.,,,的平均數(shù)等于,, , 的平均數(shù)B.,,,的中位數(shù)等于,, , 的中位數(shù)C.,,,的標準差不小于,, , 的標準差D.,,,的極差不大于,, , 的極差√√[解析] 對于A,這一組樣本數(shù)據(jù)可取1,2,2,2,2,4,則2,2,2,2的平均數(shù)不等于1,2,2,2,2,4的平均數(shù),故A錯誤;對于B,不妨設,則,,,的中位數(shù)為 ,而,,,,,的中位數(shù)也為 ,故B正確;對于C,根據(jù)題意可知,,,,,,的數(shù)據(jù)波動性大于,,, 的數(shù)據(jù)波動性,故,,,的標準差小于,,,,, 的標準差,故C錯誤;對于D,不妨設,則 ,故,故D正確.故選 .4.[2020·全國新高考Ⅰ卷] 為加強環(huán)境保護,治理空氣污染,環(huán)境監(jiān)測部門對某市空氣質(zhì)量進行調(diào)研,隨機抽查了100天空氣中的 和濃度(單位: ),得下表:32 18 46 8 123 7 10(1)估計事件“該市一天空氣中濃度不超過75,且 濃度不超過150”的概率;解:根據(jù)抽查數(shù)據(jù),該市100天的空氣中濃度不超過75,且 濃度不超過150的天數(shù)為 ,因此,該市一天空氣中濃度不超過75,且 濃度不超過150的概率的估計值為 .(2)根據(jù)所給數(shù)據(jù),完成下面的 列聯(lián)表:根據(jù)抽查數(shù)據(jù),可得列聯(lián)表:64 1610 10(3)根據(jù)(2)中的列聯(lián)表,判斷是否有 的把握認為該市一天空氣中濃度與 濃度有關?附: ,0.050 0.010 0.0013.841 6.635 10.828解:根據(jù)(2)的列聯(lián)表得 .由于,故有的把握認為該市一天空氣中 濃度與 濃度有關.[備選理由]例1考查平均數(shù)、方差的計算;例2考查最小二乘估計和回歸分析;例3考查模型擬合與正態(tài)分布等知識的應用;例4考查獨立性檢驗與二項分布知識的應用.例1 [配例1使用] [2024·廣東江門一模] 已知9名女生的身高平均值為162(單位:),方差為26,若增加一名身高172(單位: )的女生,則這10名女生身高的方差為( )A.32.4 B.32.8 C.31.4 D.31.8√[解析] 設9名女生的身高為 ,依題意得, ,因此增加一名女生后身高的平均值為 ,所以這10名女生身高的方差為 .故選A.例2 [配例2使用][2024·華師大一附中模擬](1)假設變量與變量的對觀測數(shù)據(jù)為,, ,,兩個變量滿足一元線性回歸模型請寫出參數(shù) 的最小二乘估計.解: ,要使取得最小值,當且僅當?shù)娜≈禐椋?br/>所以參數(shù) 的最小二乘估計為 .(2)為推動新能源汽車產(chǎn)業(yè)高質(zhì)量發(fā)展,國家出臺了一系列政策,給新能源汽車產(chǎn)業(yè)發(fā)展帶來了巨大的推動效果.如表是某新能源汽車品牌從2019年到2023年新能源汽車的年銷量(萬輛)與年份代碼之間的對應數(shù)據(jù)(2019年的年份代碼為1,2020年的年份代碼為2,以此類推).已知根據(jù)散點圖和樣本相關系數(shù)判斷,與 之間具有較強的線性相關關系,可以用線性回歸模型擬合.年份代碼 1 2 3 4 5年銷量 (萬) 4 9 14 18 25令變量,,則變量與變量 滿足一元線性回歸模型利用(1)中結論求關于 的經(jīng)驗回歸方程,并預測2025年該品牌新能源汽車的年銷量.解:由題知, ,所以,,所以,所以 ,所以,即 ,所以 .當時, ,故關于的經(jīng)驗回歸方程為 ,預測2025年該品牌新能源汽車的年銷量為34.4萬輛.例3 [配例2使用] [2024·河北滄州模擬] 南澳牡蠣是我國國家地理標志產(chǎn)品,產(chǎn)量高、肉質(zhì)肥、營養(yǎng)好,素有“海洋牛奶精品”的美譽.某南澳牡蠣養(yǎng)殖基地考慮增加人工投入,現(xiàn)有以往的人工投入增量(人)與年收益增量 (萬元)的數(shù)據(jù)如下:人工投入增量 (人) 2 3 4 6 8 10 13年收益增量 (萬元) 13 22 31 42 50 56 58該基地為了預測人工投入增量為16人時的年收益增量,建立了與的兩個回歸模型:模型①:由最小二乘法可求得關于 的經(jīng)驗回歸方程為;模型②:由散點圖的樣本點分布,如圖所示,可以認為樣本點集中在曲線的附近,令 ,則,且, ,,.(1)(ⅰ)根據(jù)所給的統(tǒng)計量,求模型②中關于 的經(jīng)驗回歸方程(系數(shù)精確到 );附: 經(jīng)驗回歸直線 的斜率和截距的最小二乘估計公式分別為, .解:由,,,,得 ,且 ,所以模型②中關于的經(jīng)驗回歸方程為 .(ⅱ)根據(jù)下列表格中的數(shù)據(jù),比較兩種模型的決定系數(shù) ,并選擇擬合效果更好的模型,預測人工投入增量為16人時的年收益增量.回歸模型 模型① 模型②經(jīng)驗回歸方程182.4 79.2附: 決定系數(shù) .解:由表格中的數(shù)據(jù),得,故 ,設模型①與模型②的決定系數(shù)分別為,,則 ,說明模型②的擬合效果更好.當 時,由模型②知年收益增量的預測值為,所以預測人工投入增量為16人時的年收益增量為70.8萬元.(2)根據(jù)養(yǎng)殖規(guī)模與以往的養(yǎng)殖經(jīng)驗,產(chǎn)自該養(yǎng)殖基地的單個南澳牡蠣的質(zhì)量(單位: )在正常環(huán)境下服從正態(tài)分布 .購買10只該基地的南澳牡蠣,會買到質(zhì)量小于 的牡蠣的可能性有多大 附:若隨機變量 ,則 ,.解:由題意知,單個南澳牡蠣的質(zhì)量,則, ,由正態(tài)分布的對稱性可知, .設購買10只該基地的南澳牡蠣,其中質(zhì)量小于的牡蠣有 只,故 ,所以 ,所以購買10只該基地的南澳牡蠣,會買到質(zhì)量小于 的牡蠣的可能性約為 .例4 [配例3使用] [2024·山東德州一中三模] 向“新”而行,向“新”而進,新質(zhì)生產(chǎn)力能夠更好地推動高質(zhì)量發(fā)展.以人工智能的應用為例,人工智能中的文生視頻模型(以下簡稱 ),能夠根據(jù)用戶的文本提示創(chuàng)建最長60秒的逼真視頻.為調(diào)查 的應用是否會對視頻從業(yè)人員產(chǎn)生影響,某學校研究小組隨機抽取了120名視頻從業(yè)人員進行調(diào)查,結果如表所示.的應用情況 視頻從業(yè)人員 合計影響 沒有影響 應用 70 75沒有應用 15合計 100 120單位:人(1)根據(jù)所給數(shù)據(jù)完成上表,依據(jù)小概率值 的獨立性檢驗,能否認為 的應用對視頻從業(yè)人員有影響?附:,其中 .0.010 0.005 0.0016.635 7.879 10.828解:依題意, 列聯(lián)表如下:單位:人的應用情況 視頻從業(yè)人員 合計影響 沒有影響 應用 70 5 75沒有應用 30 15 45合計 100 20 120零假設為 的應用對視頻從業(yè)人員沒有影響,由列聯(lián)表中的數(shù)據(jù)得,,根據(jù)小概率值的獨立性檢驗,推斷不成立,即認為 的應用對視頻從業(yè)人員有影響,此推斷犯錯誤的概率不超過0.001.(2)某公司視頻部現(xiàn)有員工100人,公司擬開展 培訓,分三輪進行,每位員工第一輪至第三輪培訓達到“優(yōu)秀”的概率分別為,, ,每輪相互獨立,有二輪及以上獲得“優(yōu)秀”的員工才能應用 .(ⅰ)求一名員工經(jīng)過培訓能應用 的概率.解:設“員工第輪獲得‘優(yōu)秀’”,則,, 相互獨立.設“一名員工經(jīng)過培訓能應用 ”,則,故一名員工經(jīng)過培訓能應用的概率是 .(ⅱ)已知開展 培訓前,員工每人每年平均為公司創(chuàng)造利潤6萬元;開展培訓后,能應用 的員工每人每年平均為公司創(chuàng)造利潤10萬元. 培訓平均每人每年成本為1萬元.根據(jù)公司發(fā)展需要,計劃先將視頻部的部分員工隨機調(diào)至其他部門,然后對剩余員工開展 培訓,現(xiàn)要求培訓后視頻部的年利潤不低于員工調(diào)整前的年利潤,則視頻部最多可以調(diào)多少人到其他部門?解:設視頻部調(diào)人至其他部門,,,為培訓后視頻部能應用 的人數(shù),則 ,所以 .調(diào)整后視頻部的年利潤為(萬元),令,解得,又 ,所以 ,所以視頻部最多可以調(diào)14人到其他部門. 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫