資源簡介 / 讓教學更有效 精品試卷 |數(shù)學第02講 成對數(shù)據(jù)的統(tǒng)計分析(考綱導向小)考點要求 考題統(tǒng)計 考情分析(1) 相關系數(shù)的統(tǒng)計含義 (2) 最小二乘估計方法與一元線性回歸模型 (3) 列聯(lián)表與獨立性檢驗 2024年天津卷5分2024年甲卷15分2023年天津卷5分2023年甲卷12分2022年甲卷12分2022年I卷12分2022年乙卷12分2021年甲卷12分(1)本講為高考命題熱點,題型以選擇題和解答題為主; (2)重點是樣本相關系數(shù)的統(tǒng)計含義、最小二乘法原理、一元線性回歸模型、列聯(lián)表和獨立性檢驗,主要考查相關系數(shù)的理解,一元線性回歸模型參數(shù)的最小二乘估計方法,用一元線性回歸模型進行預測實際問題,列聯(lián)表的統(tǒng)計意義和獨立性檢驗的應用.(考試要求小)1、了解樣本相關系數(shù)的統(tǒng)計含義;2、了解最小二乘法原理,掌握一元線性回歸模型參數(shù)的最小二乘估計方法;3、針對實際問題,會用一元線性回歸模型進行預測;4、通過實例,理解列聯(lián)表的統(tǒng)計意義;5、通過實例,了解獨立性檢驗及其應用.(考點突破考綱解讀)(考點梳理小)知識點1: 成對數(shù)據(jù)的相關性1、變量的相關關系(1)相關關系:兩個變量有關系,但是沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系;(2)分類:正相關和負相關;(3)線性相關:如果兩個變量的取值呈現(xiàn)正相關或負相關,而且散點落在一條直線附近,稱這個兩個變量線性相關;2、樣本相關系數(shù)(1);(2)當時,稱成對樣本數(shù)據(jù)正相關;當時,稱成對樣本數(shù)據(jù)負相關;(3);當越接近1時,成對樣本數(shù)據(jù)的線性相關程度越強;當越接近0時,成對樣本數(shù)據(jù)的線性相關程度越弱;知識點2: 一元線性回歸模型1、一元線性回歸模型(1)將稱為關于的經驗回歸方程,其中(2)殘差:觀測值減去預測值稱為殘差;知識點3: 列聯(lián)表與獨立性檢驗1、分類變量為了表述方便,我們經常會使用一種特殊的隨機變量,以區(qū)別不同的現(xiàn)象或性質,這類隨機變量稱為分類變量;分類變量的取值可以用實數(shù)表示;2、列聯(lián)表和獨立性檢驗(1)關于分類變量和的抽樣數(shù)據(jù)的列聯(lián)表:合計合計(2)獨立性檢驗計算隨機變量,利用的取值推斷分類變量和是否獨立的方法稱為獨立性檢驗;(題型展示小)題型一: 成對數(shù)據(jù)的相關關系【例1】(2024·天津)下列圖中,線性相關性系數(shù)最大的是( )A. B.C. D.【答案】A【解析】觀察4幅圖可知,A圖散點分布比較集中,且大體接近某一條直線,線性回歸模型擬合效果比較好,呈現(xiàn)明顯的正相關,值相比于其他3圖更接近1;答案為A.【變式1】(2023·天津)鳶是鷹科的一種鳥,《詩經·大雅·旱麓》曰:“鳶飛戾天,魚躍余淵”. 鳶尾花因花瓣形如鳶尾而得名,寓意鵬程萬里、前途無量.通過隨機抽樣,收集了若干朵某品種鳶尾花的花萼長度和花瓣長度(單位:cm),繪制散點圖如圖所示,計算得樣本相關系數(shù)為,利用最小二乘法求得相應的經驗回歸方程為,根據(jù)以上信息,如下判斷正確的為( )A.花瓣長度和花萼長度不存在相關關系B.花瓣長度和花萼長度負相關C.花萼長度為7cm的該品種鳶尾花的花瓣長度的平均值為D.若從樣本中抽取一部分,則這部分的相關系數(shù)一定是【答案】C【解析】對A,根據(jù)散點的集中程度可知,花瓣長度和花萼長度有相關性,A錯;對B,散點的分布是從左下到右上,從而花瓣長度和花萼長度呈現(xiàn)正相關性,B錯;對C,把代入可得,C正確;對D,由于是全部數(shù)據(jù)的相關系數(shù),取出來一部分數(shù)據(jù),相關性可能變強,可能變弱,即取出的數(shù)據(jù)的相關系數(shù)不一定是,D錯;答案為C.題型二: 線性回歸模型【例2】下圖是某地區(qū)2000年至2016年環(huán)境基礎設施投資額(單位:億元)的折線圖.為了預測該地區(qū)2018年的環(huán)境基礎設施投資額,建立了與時間變量的兩個線性回歸模型.根據(jù)2000年至2016年的數(shù)據(jù)(時間變量的值依次為)建立模型①:;根據(jù)2010年至2016年的數(shù)據(jù)(時間變量的值依次為)建立模型②:. (1)分別利用這兩個模型,求該地區(qū)2018年的環(huán)境基礎設施投資額的預測值; (2)你認為用哪個模型得到的預測值更可靠?并說明理由.【答案】(1)模型①預測值為226.1,模型②預測值為256.5,(2)利用模型②得到的預測值更可靠.【解析】(1)利用模型①,該地區(qū)2018年的環(huán)境基礎設施投資額的預測值為 =–30.4+13.5×19=226.1(億元).利用模型②,該地區(qū)2018年的環(huán)境基礎設施投資額的預測值為=99+17.5×9=256.5(億元).(2)利用模型②得到的預測值更可靠.理由如下:(i)從折線圖可以看出,2000年至2016年的數(shù)據(jù)對應的點沒有隨機散布在直線y=–30.4+13.5t上下,這說明利用2000年至2016年的數(shù)據(jù)建立的線性模型①不能很好地描述環(huán)境基礎設施投資額的變化趨勢.2010年相對2009年的環(huán)境基礎設施投資額有明顯增加,2010年至2016年的數(shù)據(jù)對應的點位于一條直線的附近,這說明從2010年開始環(huán)境基礎設施投資額的變化規(guī)律呈線性增長趨勢,利用2010年至2016年的數(shù)據(jù)建立的線性模型=99+17.5t可以較好地描述2010年以后的環(huán)境基礎設施投資額的變化趨勢,因此利用模型②得到的預測值更可靠.(ii)從計算結果看,相對于2016年的環(huán)境基礎設施投資額220億元,由模型①得到的預測值226.1億元的增幅明顯偏低,而利用模型②得到的預測值的增幅比較合理,說明利用模型②得到的預測值更可靠.【變式2】隨著我國經濟的發(fā)展,居民的儲蓄存款逐年增長.設某地區(qū)城鄉(xiāng)居民人民幣儲蓄存款(年底余額)如下表:年份 2020 2021 2022 2023 2024時間代號 1 2 3 4 5儲蓄存款(千億元) 5 6 7 8 10(Ⅰ)求y關于t的回歸方程(Ⅱ)用所求回歸方程預測該地區(qū)2015年()的人民幣儲蓄存款.附:回歸方程中;【答案】(Ⅰ),(Ⅱ)千億元.【解析】(1)列表計算如下i1 1 5 1 52 2 6 4 123 3 7 9 214 4 8 16 325 5 10 25 5015 36 55 120又;所求回歸方程為.(2)將代入回歸方程可預測該地區(qū)2015年的人民幣儲蓄存款為題型三: 列聯(lián)表和獨立性檢驗【例3】為加強環(huán)境保護,治理空氣污染,環(huán)境監(jiān)測部門對某市空氣質量進行調研,隨機抽查了天空氣中的和濃度(單位:),得下表:(1)估計事件“該市一天空氣中濃度不超過,且濃度不超過”的概率;(2)根據(jù)所給數(shù)據(jù),完成下面的列聯(lián)表:(3)根據(jù)(2)中的列聯(lián)表,判斷是否有的把握認為該市一天空氣中濃度與濃度有關?附:,【答案】(1);(2)答案見解析;(3)有.【解析】(1)由表格可知,該市100天中,空氣中的濃度不超過75,且濃度不超過150的天數(shù)有天,該市一天中,空氣中的濃度不超過75,且濃度不超過150的概率為;(2)由所給數(shù)據(jù),可得列聯(lián)表為:合計64 16 8010 10 20合計 74 26 100(3)根據(jù)列聯(lián)表中的數(shù)據(jù)可得,根據(jù)臨界值表可知,有的把握認為該市一天空氣中濃度與濃度有關.【變式3】某學生興趣小組隨機調查了某市100天中每天的空氣質量等級和當天到某公園鍛煉的人次,整理數(shù)據(jù)得到下表(單位:天):鍛煉人次空氣質量等級 [0,200] (200,400] (400,600]1(優(yōu)) 2 16 252(良) 5 10 123(輕度污染) 6 7 84(中度污染) 7 2 0(1)分別估計該市一天的空氣質量等級為1,2,3,4的概率;(2)求一天中到該公園鍛煉的平均人次的估計值(同一組中的數(shù)據(jù)用該組區(qū)間的中點值為代表);(3)若某天的空氣質量等級為1或2,則稱這天“空氣質量好”;若某天的空氣質量等級為3或4,則稱這天“空氣質量不好”.根據(jù)所給數(shù)據(jù),完成下面的2×2列聯(lián)表,并根據(jù)列聯(lián)表,判斷是否有95%的把握認為一天中到該公園鍛煉的人次與該市當天的空氣質量有關?人次≤400 人次>400空氣質量好空氣質量不好附:,P(K2≥k) 0.050 0.010 0.001k 3.841 6.635 10.828【答案】(1)該市一天的空氣質量等級分別為、、、的概率分別為、、、;(2);(3)有,理由見解析.【解析】(1)由頻數(shù)分布表可知,該市一天的空氣質量等級為的概率為,等級為的概率為,等級為的概率為,等級為的概率為;(2)由頻數(shù)分布表可知,一天中到該公園鍛煉的人次的平均數(shù)為;(3)列聯(lián)表如下:人次 人次空氣質量好空氣質量不好,有的把握認為一天中到該公園鍛煉的人次與該市當天的空氣質量有關.(考場演練)【真題1】(2024·全國甲卷)某工廠進行生產線智能化升級改造,升級改造后,從該工廠甲、乙兩個車間的產品中隨機抽取150件進行檢驗,數(shù)據(jù)如下:優(yōu)級品 合格品 不合格品 總計甲車間 26 24 0 50乙車間 70 28 2 100總計 96 52 2 150(1)填寫如下列聯(lián)表:優(yōu)級品 非優(yōu)級品甲車間乙車間能否有的把握認為甲、乙兩車間產品的優(yōu)級品率存在差異?能否有的把握認為甲,乙兩車間產品的優(yōu)級品率存在差異?(2)已知升級改造前該工廠產品的優(yōu)級品率,設為升級改造后抽取的n件產品的優(yōu)級品率.如果,則認為該工廠產品的優(yōu)級品率提高了,根據(jù)抽取的150件產品的數(shù)據(jù),能否認為生產線智能化升級改造后,該工廠產品的優(yōu)級品率提高了?()附:0.050 0.010 0.001k 3.841 6.635 10.828【解析】(1)根據(jù)題意可得列聯(lián)表:優(yōu)級品 非優(yōu)級品甲車間 26 24乙車間 70 30可得,,有的把握認為甲、乙兩車間產品的優(yōu)級品率存在差異,沒有的把握認為甲,乙兩車間產品的優(yōu)級品率存在差異.(2)生產線智能化升級改造后,該工廠產品的優(yōu)級品的頻率為,用頻率估計概率可得,升級改造前該工廠產品的優(yōu)級品率,則,可知,可以認為生產線智能化升級改造后,該工廠產品的優(yōu)級品率提高了.【真題2】(2024·天津)下列圖中,線性相關性系數(shù)最大的是( )A. B.C. D.【答案】A【解析】觀察4幅圖可知,A圖散點分布比較集中,且大體接近某一條直線,線性回歸模型擬合效果比較好,呈現(xiàn)明顯的正相關,值相比于其他3圖更接近1;答案為A.【真題3】(2023·全國甲卷)一項試驗旨在研究臭氧效應.實驗方案如下:選40只小白鼠,隨機地將其中20只分配到實驗組,另外20只分配到對照組,實驗組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠飼養(yǎng)在正常環(huán)境,一段時間后統(tǒng)計每只小白鼠體重的增加量(單位:g).(1)設表示指定的兩只小白鼠中分配到對照組的只數(shù),求的分布列和數(shù)學期望;(2)實驗結果如下:對照組的小白鼠體重的增加量從小到大排序為:15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.132.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2實驗組的小白鼠體重的增加量從小到大排序為:7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.219.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5(i)求40只小鼠體重的增加量的中位數(shù)m,再分別統(tǒng)計兩樣本中小于m與不小于的數(shù)據(jù)的個數(shù),完成如下列聯(lián)表:對照組實驗組(ii)根據(jù)(i)中的列聯(lián)表,能否有95%的把握認為小白鼠在高濃度臭氧環(huán)境中與正常環(huán)境中體重的增加量有差異.附:0.100 0.050 0.0102.706 3.841 6.635【答案】(1)見解析,;(2)(i);見解析,(ii)能【解析】(1)依題意,的可能取值為,則,,,所以的分布列為:故.(2)(i)依題意,可知這40只小白鼠體重增量的中位數(shù)是將兩組數(shù)據(jù)合在一起,從小到大排后第20位與第21位數(shù)據(jù)的平均數(shù),觀察數(shù)據(jù)可得第20位為,第21位數(shù)據(jù)為,,故列聯(lián)表為:合計對照組 6 14 20實驗組 14 6 20合計 20 20 40(ii)由(i)可得,,能有的把握認為小白鼠在高濃度臭氧環(huán)境中與正常環(huán)境中體重的增加量有差異.【真題4】(2023·天津)鳶是鷹科的一種鳥,《詩經·大雅·旱麓》曰:“鳶飛戾天,魚躍余淵”. 鳶尾花因花瓣形如鳶尾而得名,寓意鵬程萬里、前途無量.通過隨機抽樣,收集了若干朵某品種鳶尾花的花萼長度和花瓣長度(單位:cm),繪制散點圖如圖所示,計算得樣本相關系數(shù)為,利用最小二乘法求得相應的經驗回歸方程為,根據(jù)以上信息,如下判斷正確的為( )A.花瓣長度和花萼長度不存在相關關系B.花瓣長度和花萼長度負相關C.花萼長度為7cm的該品種鳶尾花的花瓣長度的平均值為D.若從樣本中抽取一部分,則這部分的相關系數(shù)一定是【答案】C【解析】對A,根據(jù)散點的集中程度可知,花瓣長度和花萼長度有相關性,A錯;對B,散點的分布是從左下到右上,從而花瓣長度和花萼長度呈現(xiàn)正相關性,B錯;對C,把代入可得,C正確;對D,由于是全部數(shù)據(jù)的相關系數(shù),取出來一部分數(shù)據(jù),相關性可能變強,可能變弱,即取出的數(shù)據(jù)的相關系數(shù)不一定是,D錯;答案為C.【真題5】(2022·全國乙卷)某地經過多年的環(huán)境治理,已將荒山改造成了綠水青山.為估計一林區(qū)某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:)和材積量(單位:),得到如下數(shù)據(jù):樣本號i 1 2 3 4 5 6 7 8 9 10 總和根部橫截面積 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材積量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并計算得.(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關系數(shù)(精確到0.01);(3)現(xiàn)測量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數(shù)據(jù)給出該林區(qū)這種樹木的總材積量的估計值.附:相關系數(shù).【答案】(1);;(2);(3)【解析】(1)樣本中10棵這種樹木的根部橫截面積的平均值;樣本中10棵這種樹木的材積量的平均值;據(jù)此可估計該林區(qū)這種樹木平均一棵的根部橫截面積為,平均一棵的材積量為;(2),則(3)設該林區(qū)這種樹木的總材積量的估計值為,樹木的材積量與其根部橫截面積近似成正比,可得,解之得;則該林區(qū)這種樹木的總材積量估計為.【真題6】(2022·全國新Ⅰ卷)一醫(yī)療團隊為研究某地的一種地方性疾病與當?shù)鼐用竦男l(wèi)生習慣(衛(wèi)生習慣分為良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查了100例(稱為病例組),同時在未患該疾病的人群中隨機調查了100人(稱為對照組),得到如下數(shù)據(jù):不夠良好 良好病例組 40 60對照組 10 90(1)能否有99%的把握認為患該疾病群體與未患該疾病群體的衛(wèi)生習慣有差異?(2)從該地的人群中任選一人,A表示事件“選到的人衛(wèi)生習慣不夠良好”,B表示事件“選到的人患有該疾病”.與的比值是衛(wèi)生習慣不夠良好對患該疾病風險程度的一項度量指標,記該指標為R.(ⅰ)證明:;(ⅱ)利用該調查數(shù)據(jù),給出的估計值,并利用(?。┑慕Y果給出R的估計值.附,0.050 0.010 0.001k 3.841 6.635 10.828【答案】(1)見解析(2)(i)見解析;(ii);【解析】(1)由已知,又,,有99%的把握認為患該疾病群體與未患該疾病群體的衛(wèi)生習慣有差異.(2)(i) ,,;(ii) 由已知,,又,,;【真題7】(2022·全國甲卷)甲、乙兩城之間的長途客車均由A和B兩家公司運營,為了解這兩家公司長途客車的運行情況,隨機調查了甲、乙兩城之間的500個班次,得到下面列聯(lián)表:準點班次數(shù) 未準點班次數(shù)A 240 20B 210 30(1)根據(jù)上表,分別估計這兩家公司甲、乙兩城之間的長途客車準點的概率;(2)能否有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關?附:,0.100 0.050 0.0102.706 3.841 6.635【答案】(1)A,B兩家公司長途客車準點的概率分別為,;(2)有【解析】(1)根據(jù)表中數(shù)據(jù),A共有班次260次,準點班次有240次,設A家公司長途客車準點事件為M,則;B共有班次240次,準點班次有210次,設B家公司長途客車準點事件為N,則;A家公司長途客車準點的概率為;B家公司長途客車準點的概率為.(2)列聯(lián)表準點班次數(shù) 未準點班次數(shù) 合計A 240 20 260B 210 30 240合計 450 50 500=,根據(jù)臨界值表可知,有的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關.【真題8】(2021·全國甲卷)甲、乙兩臺機床生產同種產品,產品按質量分為一級品和二級品,為了比較兩臺機床產品的質量,分別用兩臺機床各生產了200件產品,產品的質量情況統(tǒng)計如下表:一級品 二級品 合計甲機床 150 50 200乙機床 120 80 200合計 270 130 400(1)甲機床、乙機床生產的產品中一級品的頻率分別是多少 (2)能否有99%的把握認為甲機床的產品質量與乙機床的產品質量有差異 附:0.050 0.010 0.001k 3.841 6.635 10.828【答案】(1)75%;60%;(2)能.【解析】(1)甲機床生產的產品中的一級品的頻率為,乙機床生產的產品中的一級品的頻率為;(2),能有99%的把握認為甲機床的產品與乙機床的產品質量有差異.【真題9】(2020·全國)某校一個課外學習小組為研究某作物種子的發(fā)芽率y和溫度x(單位:°C)的關系,在20個不同的溫度條件下進行種子發(fā)芽實驗,由實驗數(shù)據(jù)得到下面的散點圖:由此散點圖,在10°C至40°C之間,下面四個回歸方程類型中最適宜作為發(fā)芽率y和溫度x的回歸方程類型的是( )A. B.C. D.【答案】D【解析】由散點圖分布可知,散點圖分布在一個對數(shù)函數(shù)的圖象附近,最適合作為發(fā)芽率和溫度的回歸方程類型的是;答案為D.【真題10】(2020·全國)某沙漠地區(qū)經過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有所增加.為調查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區(qū),調查得到樣本數(shù)據(jù)(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動物的數(shù)量,并計算得,,,,.(1)求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣區(qū)這種野生動物數(shù)量的平均數(shù)乘以地塊數(shù));(2)求樣本(xi,yi)(i=1,2,…,20)的相關系數(shù)(精確到0.01);(3)根據(jù)現(xiàn)有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區(qū)這種野生動物數(shù)量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由.附:相關系數(shù)r=,【答案】(1);(2);(3)詳見解析【解析】(1)樣區(qū)野生動物平均數(shù)為,地塊數(shù)為200,該地區(qū)這種野生動物的估計值為;(2)樣本(i=1,2,…,20)的相關系數(shù)為;(3)由(2)知各樣區(qū)的這種野生動物的數(shù)量與植物覆蓋面積有很強的正相關性,由于各地塊間植物覆蓋面積差異很大,從而各地塊間這種野生動物的數(shù)量差異很大,采用分層抽樣的方法較好地保持了樣本結構與總體結構的一致性,提高了樣本的代表性,從而可以獲得該地區(qū)這種野生動物數(shù)量更準確的估計.21世紀教育網 www.21cnjy.com 精品試卷·第 2 頁 (共 2 頁)21世紀教育網(www.21cnjy.com)/ 讓教學更有效 精品試卷 |數(shù)學第02講 成對數(shù)據(jù)的統(tǒng)計分析(考綱導向小)考點要求 考題統(tǒng)計 考情分析(1) 相關系數(shù)的統(tǒng)計含義 (2) 最小二乘估計方法與一元線性回歸模型 (3) 列聯(lián)表與獨立性檢驗 2024年天津卷5分2024年甲卷15分2023年天津卷5分2023年甲卷12分2022年甲卷12分2022年I卷12分2022年乙卷12分2021年甲卷12分(1)本講為高考命題熱點,題型以選擇題和解答題為主; (2)重點是樣本相關系數(shù)的統(tǒng)計含義、最小二乘法原理、一元線性回歸模型、列聯(lián)表和獨立性檢驗,主要考查相關系數(shù)的理解,一元線性回歸模型參數(shù)的最小二乘估計方法,用一元線性回歸模型進行預測實際問題,列聯(lián)表的統(tǒng)計意義和獨立性檢驗的應用.(考試要求小)1、了解樣本相關系數(shù)的統(tǒng)計含義;2、了解最小二乘法原理,掌握一元線性回歸模型參數(shù)的最小二乘估計方法;3、針對實際問題,會用一元線性回歸模型進行預測;4、通過實例,理解列聯(lián)表的統(tǒng)計意義;5、通過實例,了解獨立性檢驗及其應用.(考點突破考綱解讀)(考點梳理小)知識點1: 成對數(shù)據(jù)的相關性1、變量的相關關系(1)相關關系:兩個變量有關系,但是沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為 ;(2)分類: 和 ;(3)線性相關:如果兩個變量的取值呈現(xiàn)正相關或負相關,而且散點落在一條直線附近,稱這個兩個變量 ;2、樣本相關系數(shù)(1);(2)當時,稱成對樣本數(shù)據(jù)正相關;當時,稱成對樣本數(shù)據(jù)負相關;(3);當越接近1時,成對樣本數(shù)據(jù)的線性相關程度越 ;當越接近0時,成對樣本數(shù)據(jù)的線性相關程度越 ;知識點2: 一元線性回歸模型1、一元線性回歸模型(1)將稱為關于的經驗回歸方程,其中(2)殘差:觀測值減去預測值稱為殘差;知識點3: 列聯(lián)表與獨立性檢驗1、分類變量為了表述方便,我們經常會使用一種特殊的隨機變量,以區(qū)別不同的現(xiàn)象或性質,這類隨機變量稱為分類變量;分類變量的取值可以用實數(shù)表示;2、列聯(lián)表和獨立性檢驗(1)關于分類變量和的抽樣數(shù)據(jù)的列聯(lián)表:合計合計(2)獨立性檢驗計算隨機變量,利用的取值推斷分類變量和是否獨立的方法稱為 ;(題型展示小)題型一: 成對數(shù)據(jù)的相關關系【例1】(2024·天津)下列圖中,線性相關性系數(shù)最大的是( )A. B.C. D.【變式1】(2023·天津)鳶是鷹科的一種鳥,《詩經·大雅·旱麓》曰:“鳶飛戾天,魚躍余淵”. 鳶尾花因花瓣形如鳶尾而得名,寓意鵬程萬里、前途無量.通過隨機抽樣,收集了若干朵某品種鳶尾花的花萼長度和花瓣長度(單位:cm),繪制散點圖如圖所示,計算得樣本相關系數(shù)為,利用最小二乘法求得相應的經驗回歸方程為,根據(jù)以上信息,如下判斷正確的為( )A.花瓣長度和花萼長度不存在相關關系B.花瓣長度和花萼長度負相關C.花萼長度為7cm的該品種鳶尾花的花瓣長度的平均值為D.若從樣本中抽取一部分,則這部分的相關系數(shù)一定是題型二: 線性回歸模型【例2】下圖是某地區(qū)2000年至2016年環(huán)境基礎設施投資額(單位:億元)的折線圖.為了預測該地區(qū)2018年的環(huán)境基礎設施投資額,建立了與時間變量的兩個線性回歸模型.根據(jù)2000年至2016年的數(shù)據(jù)(時間變量的值依次為)建立模型①:;根據(jù)2010年至2016年的數(shù)據(jù)(時間變量的值依次為)建立模型②:. (1)分別利用這兩個模型,求該地區(qū)2018年的環(huán)境基礎設施投資額的預測值;(2)你認為用哪個模型得到的預測值更可靠?并說明理由.【變式2】隨著我國經濟的發(fā)展,居民的儲蓄存款逐年增長.設某地區(qū)城鄉(xiāng)居民人民幣儲蓄存款(年底余額)如下表:年份 2020 2021 2022 2023 2024時間代號 1 2 3 4 5儲蓄存款(千億元) 5 6 7 8 10(Ⅰ)求y關于t的回歸方程(Ⅱ)用所求回歸方程預測該地區(qū)2015年()的人民幣儲蓄存款.附:回歸方程中;題型三: 列聯(lián)表和獨立性檢驗【例3】為加強環(huán)境保護,治理空氣污染,環(huán)境監(jiān)測部門對某市空氣質量進行調研,隨機抽查了天空氣中的和濃度(單位:),得下表:(1)估計事件“該市一天空氣中濃度不超過,且濃度不超過”的概率;(2)根據(jù)所給數(shù)據(jù),完成下面的列聯(lián)表:(3)根據(jù)(2)中的列聯(lián)表,判斷是否有的把握認為該市一天空氣中濃度與濃度有關?附:,【變式3】某學生興趣小組隨機調查了某市100天中每天的空氣質量等級和當天到某公園鍛煉的人次,整理數(shù)據(jù)得到下表(單位:天):鍛煉人次空氣質量等級 [0,200] (200,400] (400,600]1(優(yōu)) 2 16 252(良) 5 10 123(輕度污染) 6 7 84(中度污染) 7 2 0(1)分別估計該市一天的空氣質量等級為1,2,3,4的概率;(2)求一天中到該公園鍛煉的平均人次的估計值(同一組中的數(shù)據(jù)用該組區(qū)間的中點值為代表);(3)若某天的空氣質量等級為1或2,則稱這天“空氣質量好”;若某天的空氣質量等級為3或4,則稱這天“空氣質量不好”.根據(jù)所給數(shù)據(jù),完成下面的2×2列聯(lián)表,并根據(jù)列聯(lián)表,判斷是否有95%的把握認為一天中到該公園鍛煉的人次與該市當天的空氣質量有關?人次≤400 人次>400空氣質量好空氣質量不好附:,P(K2≥k) 0.050 0.010 0.001k 3.841 6.635 10.828(考場演練)【真題1】(2024·全國甲卷)某工廠進行生產線智能化升級改造,升級改造后,從該工廠甲、乙兩個車間的產品中隨機抽取150件進行檢驗,數(shù)據(jù)如下:優(yōu)級品 合格品 不合格品 總計甲車間 26 24 0 50乙車間 70 28 2 100總計 96 52 2 150(1)填寫如下列聯(lián)表:優(yōu)級品 非優(yōu)級品甲車間乙車間能否有的把握認為甲、乙兩車間產品的優(yōu)級品率存在差異?能否有的把握認為甲,乙兩車間產品的優(yōu)級品率存在差異?(2)已知升級改造前該工廠產品的優(yōu)級品率,設為升級改造后抽取的n件產品的優(yōu)級品率.如果,則認為該工廠產品的優(yōu)級品率提高了,根據(jù)抽取的150件產品的數(shù)據(jù),能否認為生產線智能化升級改造后,該工廠產品的優(yōu)級品率提高了?()附:0.050 0.010 0.001k 3.841 6.635 10.828【真題2】(2024·天津)下列圖中,線性相關性系數(shù)最大的是( )A. B.C. D.【真題3】(2023·全國甲卷)一項試驗旨在研究臭氧效應.實驗方案如下:選40只小白鼠,隨機地將其中20只分配到實驗組,另外20只分配到對照組,實驗組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠飼養(yǎng)在正常環(huán)境,一段時間后統(tǒng)計每只小白鼠體重的增加量(單位:g).(1)設表示指定的兩只小白鼠中分配到對照組的只數(shù),求的分布列和數(shù)學期望;(2)實驗結果如下:對照組的小白鼠體重的增加量從小到大排序為:15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.132.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2實驗組的小白鼠體重的增加量從小到大排序為:7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.219.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5(i)求40只小鼠體重的增加量的中位數(shù)m,再分別統(tǒng)計兩樣本中小于m與不小于的數(shù)據(jù)的個數(shù),完成如下列聯(lián)表:對照組實驗組(ii)根據(jù)(i)中的列聯(lián)表,能否有95%的把握認為小白鼠在高濃度臭氧環(huán)境中與正常環(huán)境中體重的增加量有差異.附:0.100 0.050 0.0102.706 3.841 6.635【真題4】(2023·天津)鳶是鷹科的一種鳥,《詩經·大雅·旱麓》曰:“鳶飛戾天,魚躍余淵”. 鳶尾花因花瓣形如鳶尾而得名,寓意鵬程萬里、前途無量.通過隨機抽樣,收集了若干朵某品種鳶尾花的花萼長度和花瓣長度(單位:cm),繪制散點圖如圖所示,計算得樣本相關系數(shù)為,利用最小二乘法求得相應的經驗回歸方程為,根據(jù)以上信息,如下判斷正確的為( )A.花瓣長度和花萼長度不存在相關關系B.花瓣長度和花萼長度負相關C.花萼長度為7cm的該品種鳶尾花的花瓣長度的平均值為D.若從樣本中抽取一部分,則這部分的相關系數(shù)一定是【真題5】(2022·全國乙卷)某地經過多年的環(huán)境治理,已將荒山改造成了綠水青山.為估計一林區(qū)某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:)和材積量(單位:),得到如下數(shù)據(jù):樣本號i 1 2 3 4 5 6 7 8 9 10 總和根部橫截面積 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材積量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并計算得.(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關系數(shù)(精確到0.01);(3)現(xiàn)測量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數(shù)據(jù)給出該林區(qū)這種樹木的總材積量的估計值.附:相關系數(shù).【真題6】(2022·全國新Ⅰ卷)一醫(yī)療團隊為研究某地的一種地方性疾病與當?shù)鼐用竦男l(wèi)生習慣(衛(wèi)生習慣分為良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查了100例(稱為病例組),同時在未患該疾病的人群中隨機調查了100人(稱為對照組),得到如下數(shù)據(jù):不夠良好 良好病例組 40 60對照組 10 90(1)能否有99%的把握認為患該疾病群體與未患該疾病群體的衛(wèi)生習慣有差異?(2)從該地的人群中任選一人,A表示事件“選到的人衛(wèi)生習慣不夠良好”,B表示事件“選到的人患有該疾病”.與的比值是衛(wèi)生習慣不夠良好對患該疾病風險程度的一項度量指標,記該指標為R.(?。┳C明:;(ⅱ)利用該調查數(shù)據(jù),給出的估計值,并利用(?。┑慕Y果給出R的估計值.附,0.050 0.010 0.001k 3.841 6.635 10.828【真題7】(2022·全國甲卷)甲、乙兩城之間的長途客車均由A和B兩家公司運營,為了解這兩家公司長途客車的運行情況,隨機調查了甲、乙兩城之間的500個班次,得到下面列聯(lián)表:準點班次數(shù) 未準點班次數(shù)A 240 20B 210 30(1)根據(jù)上表,分別估計這兩家公司甲、乙兩城之間的長途客車準點的概率;(2)能否有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關?附:,0.100 0.050 0.0102.706 3.841 6.635【真題8】(2021·全國甲卷)甲、乙兩臺機床生產同種產品,產品按質量分為一級品和二級品,為了比較兩臺機床產品的質量,分別用兩臺機床各生產了200件產品,產品的質量情況統(tǒng)計如下表:一級品 二級品 合計甲機床 150 50 200乙機床 120 80 200合計 270 130 400(1)甲機床、乙機床生產的產品中一級品的頻率分別是多少 (2)能否有99%的把握認為甲機床的產品質量與乙機床的產品質量有差異 附:0.050 0.010 0.001k 3.841 6.635 10.828【真題9】(2020·全國)某校一個課外學習小組為研究某作物種子的發(fā)芽率y和溫度x(單位:°C)的關系,在20個不同的溫度條件下進行種子發(fā)芽實驗,由實驗數(shù)據(jù)得到下面的散點圖:由此散點圖,在10°C至40°C之間,下面四個回歸方程類型中最適宜作為發(fā)芽率y和溫度x的回歸方程類型的是( )A. B.C. D.【真題10】(2020·全國)某沙漠地區(qū)經過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有所增加.為調查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區(qū),調查得到樣本數(shù)據(jù)(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動物的數(shù)量,并計算得,,,,.(1)求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣區(qū)這種野生動物數(shù)量的平均數(shù)乘以地塊數(shù));(2)求樣本(xi,yi)(i=1,2,…,20)的相關系數(shù)(精確到0.01);(3)根據(jù)現(xiàn)有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區(qū)這種野生動物數(shù)量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由.附:相關系數(shù)r=,21世紀教育網 www.21cnjy.com 精品試卷·第 2 頁 (共 2 頁)21世紀教育網(www.21cnjy.com) 展開更多...... 收起↑ 資源列表 【高分攻略】2025高考數(shù)學一輪復習學案 --專題02成對數(shù)據(jù)的統(tǒng)計分析 (學生版) .docx 【高分攻略】2025高考數(shù)學一輪復習學案 --專題02成對數(shù)據(jù)的統(tǒng)計分析 (教師版) .docx 縮略圖、資源來源于二一教育資源庫