資源簡介 專題十三 統計【題型分析】考情分析:1.高考對本講內容的考查往往以實際問題為背景,考查隨機抽樣、用樣本估計總體以及變量的相關性,常以選擇題、填空題的形式呈現,難度中等或偏下.2.對回歸分析、獨立性檢驗的考查,多以解答題的形式出現,常與概率相結合,難度中等或偏上.題型1 用樣本估計總體用樣本的頻率分布估計總體分布例1 (改編)在某地區進行流行病學調查,隨機調查了100位某種疾病患者的年齡,得到如下的樣本數據的頻率分布直方圖:(1)估計該地區這種疾病患者的平均年齡(同一組中的數據用該組區間的中點值為代表);(2)估計該地區這種疾病患者年齡的眾數和中位數.(結果保留一位小數)方法總結:頻率分布直方圖與眾數、中位數和平均數的估計(1)最高的小矩形底邊中點的橫坐標作為眾數.(2)中位數左邊和右邊的直方圖的面積是相等的.(3)平均數是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小矩形底邊中點的橫坐標與小矩形的面積的乘積之和.(改編)在某市舉行的一次高三期中聯考中,共有2 000人參加了歷史考試.為了了解本次考試學生的成績情況,從中抽取了部分學生的成績(成績均為正整數,滿分為100分)作為樣本進行統計,樣本容量為n.按照[50,60),[60,70),[70,80),[80,90),[90,100]的分組作出頻率分布直方圖,如圖所示.其中,成績落在區間[50,60)內的人數為16.(1)求樣本容量n和圖中x的值;(2)估計該市全體學生歷史成績的平均數和中位數.統計圖表與數字特征例2 (2024年新高考全國Ⅱ卷)某農業研究部門在面積相等的100塊稻田上種植一種新型水稻,得到各塊稻田的畝產量(單位:kg)并整理得下表:畝產量 頻數[900,950) 6[950,1 000) 12[1 000,1 050) 18[1 050,1 100) 30[1 100,1 150) 24[1 150,1 200] 10根據表中數據,下列結論正確的是( ).A.100塊稻田畝產量的中位數小于1 050 kgB.100塊稻田中畝產量低于1 100 kg的稻田所占比例超過80%C.100塊稻田畝產量的極差介于200 kg至300 kg之間D.100塊稻田畝產量的平均值介于900 kg至1 000 kg之間(改編)某科技攻關團隊共有18人,他們的年齡分布如下表所示:年齡/歲 26 28 30 32 36 40 45人數 1 3 2 4 3 2 3下列說法正確的是( ).A.這18人年齡的25%分位數為29歲B.這18人年齡的80%分位數為40歲C.這18人年齡的中位數為32歲D.這18人年齡的眾數是36歲數字特征的應用例3 (2023年全國乙卷)某廠為比較甲、乙兩種工藝對橡膠產品伸縮率的處理效應,進行10次配對試驗,每次配對試驗選用材質相同的兩個橡膠產品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測量處理后的橡膠產品的伸縮率.甲、乙兩種工藝處理后的橡膠產品的伸縮率分別記為xi,yi(i=1,2,…,10),試驗結果如下:試驗序號i 1 2 3 4 5 6 7 8 9 10伸縮率xi 545 533 551 522 575 544 541 568 596 548伸縮率yi 536 527 543 530 560 533 522 550 576 536記zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的樣本平均數為,樣本方差為s2.(1)求,s2;(2)判斷甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率是否有顯著提高如果≥2,那么認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高,否則不認為有顯著提高.方法總結:處理此類問題的關鍵在于理解樣本數據方差的意義和作用,學會計算樣本的數字特征(如平均數、標準差),并作出合理的解釋.在一場文藝比賽中,10名專業人士和10名觀眾代表各組成一個評委小組給參賽選手打分,兩組評委對同一名選手的打分情況如下:小組A 45 48 46 52 47 49 55 42 51 45小組B 55 36 70 66 75 49 68 42 62 47(1)如果選擇用方差度量兩組評委打分的相似性,請計算兩組評委打分的方差;(2)據此判斷小組A和小組B哪一個是由專業人士組成的.題型2 成對數據的統計分析相關系數例4 (2022年全國乙卷)某地經過多年的環境治理,已將荒山改造成了綠水青山.為估計一林區某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:m2)和材積量(單位:m3),得到如下數據:樣本號i 1 2 3 4 5 6 7 8 9 10 總和根部橫截面積xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材積量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并計算得=0.038,=1.615 8,xiyi=0.247 4.(1)估計該林區這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)求該林區這種樹木的根部橫截面積與材積量的樣本相關系數;(精確到0.01)(3)現測量了該林區所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為186 m2.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數據給出該林區這種樹木的總材積量的估計值.附:相關系數r=,≈1.377.方法總結:判斷相關關系的兩種方法①散點圖法:如果樣本點的分布從整體上看大致在某一曲線附近,變量之間就有相關關系;如果樣本點的分布從整體上看大致在某一直線附近,變量之間就有線性相關關系.②計算相關系數r,|r|越接近1,說明兩個變量之間的線性相關性越強;|r|越接近0,說明兩個變量之間的線性相關性越弱.若兩個變量具有線性相關關系,則可通過經驗回歸方程估計和預測變量的值.經過多年的努力,我國新能源汽車產銷量占全球的比重已超過60%,中國成為世界第一大汽車出口國.某汽車城統計新能源汽車從某天開始連續的營業天數x與銷售總量y(單位:輛),采集了一組共20對數據,并計算得到經驗回歸方程=0.65x+54.50,且在這組數據中,連續的營業天數x的方差=200,銷售總量y的方差=90.(1)求樣本相關系數r,并說明y與x的相關性;(結果保留三位小數)(2)在這組數據中,若連續的營業天數x滿足=2.2×104,試推算銷售總量y的平均數.附:經驗回歸方程=x+,其中=,=-,樣本相關系數r=,≈2.24.一元回歸模型與回歸分析例5 中國茶文化博大精深,已知茶水的口感與茶葉類型以及水溫有關.經驗表明,某種綠茶用85 ℃的水泡制,再等到茶水溫度降至60 ℃時飲用,口感最佳.某學習研究小組通過測量,得到了下列表格中的數據(室溫是20 ℃):泡制時間x/min 0 1 2 3 4水溫y/℃ 85 79 74 71 65ln(y-20) 4.2 4.1 4.0 3.9 3.8(1)小組成員根據上面表格中的數據繪制散點圖,并根據散點圖分布情況,考慮到茶水溫度降到室溫(即20 ℃)就不能再降的事實,決定選擇函數模型y=kcx+20(x≥0)來刻畫.①令z=ln(y-20),求出z關于x的經驗回歸方程;②利用①的結論,求出y=kcx+20(x≥0,c>0)中的k與c.(2)你認為該品種綠茶用85 ℃的水大約泡制多久后飲用,可以使得口感最佳 參考數據:log0.90.6≈4.8,≈0.9,≈66.7,≈0.6.參考公式:=x+,=,=-.方法總結:1.求經驗回歸方程(1)利用公式求,利用=-求,寫出經驗回歸方程;(2)經驗回歸方程的擬合效果可以利用樣本相關系數r的絕對值判斷,當|r|越接近1時,成對樣本數據的線性相關程度越強,或利用決定系數R2判斷,R2越大,擬合效果越好.2.非線性經驗回歸方程轉化為線性經驗回歸方程(1)若y=a+b,設t=,則y=a+bt;(2)若滿足對數式y=a+bln x,設t=ln x,則y=a+bt;(3)若滿足指數式y=c1(c1>0),兩邊取對數得ln y=ln c1+c2x,設z=ln y,a=ln c1,b=c2,則z=a+bx.為了加快實現我國高水平科技自立自強,某科技公司逐年加大高科技研發投入.圖1是該公司2015年至2024年的年份代碼x和年研發投入y(單位:億元)的散點圖,其中年份代碼1~10分別對應年份2015—2024.根據散點圖,分別用模型①y=bx+a,②y=c+d作為年研發投入y(單位:億元)關于年份代碼x的經驗回歸方程模型,并進行殘差分析,得到圖2所示的殘差圖.結合數據,計算得到下表所示的一些統計量的值:(xi-)2 (ti-)2 (yi-)·(xi-) (yi-)·(ti-)75 2.25 82.5 4.5 120 28.35表中ti=,=ti.(1)根據殘差圖,判斷模型①和模型②哪一個更適宜作為年研發投入y(單位:億元)關于年份代碼x的經驗回歸方程模型,并說明理由.(2)根據(1)中所選模型,①求出y關于x的經驗回歸方程;②設該科技公司的年利潤L(單位:億元)和年研發投入y(單位:億元)滿足L=(111.225-y)(x∈N*且x∈[1,20]),問該科技公司哪一年的年利潤最大 附:對于一組數據(x1,y1),(x2,y2),…,(xn,yn),其經驗回歸直線=+x的斜率和截距的最小二乘估計分別為=,=-.獨立性檢驗例6 (2024年上海卷)為了解某地初中學生體育鍛煉時長與學業成績的關系,從該地區29 000名學生中抽取580人,得到日均體育鍛煉時長(單位:小時)與學業成績的數據如下表所示:學業成績 日均體育鍛煉時長/小時[0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5]優秀 5 44 42 3 1不優秀 134 147 137 40 27(1)該地區29 000名學生中日均體育鍛煉時長不小于1小時的人數約為多少 (2)估計該地區初中學生日均體育鍛煉的時長.(精確到0.1)(3)是否有95%的把握認為學業成績優秀與日均體育鍛煉時長不小于1小時且小于2小時有關 附:χ2=,其中n=a+b+c+d,P(χ2≥3.841)≈0.05.方法總結:1.在2×2列聯表中,如果兩個變量沒有關系,則應滿足|ad-bc|≈0.|ad-bc|越小,說明兩個變量之間關系越弱;|ad-bc|越大,說明兩個變量之間關系越強.2.獨立性檢驗的一般方法(1)根據題目信息,完善列聯表;(2)提出零假設:假設兩個變量獨立,并給出在問題中的解釋;(3)根據列聯表中的數據及計算公式,求出χ2的值;(4)當χ2≥xα時,我們就推斷H0不成立,即認為兩個變量不獨立,該推斷犯錯誤的概率不超過α;當χ2(改編)為了檢測A,B兩種型號的抗甲流病毒疫苗的免疫效果,某醫療科研機構對100名志愿者注射A型號疫苗,對另外100名志愿者注射B型號疫苗,一個月后,檢測這200名志愿者血液中是否產生抗體,統計結果如下表:疫苗 抗體情況有抗體 沒有抗體A型號疫苗 80 20B型號疫苗 75 25(1)根據小概率值α=0.1的獨立性檢驗,能否認為A型號疫苗比B型號疫苗效果好 (2)志愿者中已產生抗體的不用接種第二針,沒有產生抗體的志愿者需接種原型號抗甲流病毒疫苗第二針,在此前提下,第二針接種A型號疫苗后每人產生抗體的概率為,用樣本頻率估計概率,每名志愿者最多注射兩針.現從注射A型號抗甲流病毒疫苗的志愿者中隨機抽取1人,求該志愿者最多接種兩針A型號疫苗產生抗體的概率.附:χ2=(其中n=a+b+c+d).α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828【真題改編】1.(2024年新高考全國Ⅱ卷,T4改編)某工廠的研發部門為測量一批新研發的零件質量,隨機抽取了50個質量(單位:g)在[80,140]內的零件,得到各零件的質量(單位:g)并整理得下表:質量 [80,90) [90,100) [100,110) [110,120) [120,130) [130,140]頻數 3 6 10 12 10 9根據表中數據,下列結論正確的是( ).A.這50個零件的質量的75%分位數大于130 gB.這50個零件的質量的眾數介于100 g至110 g或120 g至130 g之間C.這50個零件的質量的極差介于40 g至60 g之間D.這50個零件的質量的平均值介于100 g至110 g之間2.(2024年全國甲卷,理科T17改編)某工廠進行了生產線智能化升級改造,升級改造后,從該工廠甲、乙兩個車間的產品中隨機抽取150件進行檢驗,數據如下:優級品 合格品 不合格品 總計甲車間 26 24 0 50乙車間 70 28 2 100總計 96 52 2 150(1)根據所給數據填寫表格:優級品 非優級品甲車間乙車間能否有95%的把握認為甲、乙兩車間產品的優級品率存在差異 能否有99%的把握認為甲、乙兩車間產品的優級品率存在差異 (2)已知升級改造前該工廠產品的優級品數X~B(n,p),其中優級品率p=0.5,方差為D(X),設為升級改造后抽取的n件產品的優級品率.若n(-p)>3,則認為該工廠產品的優級品率提高了.根據抽取的150件產品的數據,能否認為生產線智能化升級改造后,該工廠產品的優級品率提高了 (≈12.247,結果保留三位小數)附:χ2=,n=a+b+c+d.α 0.050 0.010 0.001xα 3.841 6.635 10.828【最新模擬】(總分:100分 單選題每題5分,多選題每題6分,填空題每題5分,共68分;解答題共32分)1.(改編)已知小唐4月17日~4月23日每天的運動時長(單位:min)統計數據如圖所示,則( ).A.小唐這7天每天運動時長的平均數是80 minB.小唐這7天每天運動時長的極差是54 minC.小唐這7天每天運動時長的中位數是75 minD.小唐這7天每天運動時長的第80百分位數是92 min2.某保險公司為客戶定制了A,B,C,D,E共5個險種,并對5個險種參保客戶進行抽樣調查,得到如下的統計圖:用該樣本估計總體,以下說法正確的有( ).A.57歲及以上的參保人數最少B.18~30歲人群參保總費用最少C.C險種更受參保人青睞D.31歲及以上的參保人群約占總參保人群的80%3.(改編)變量x與y的成對樣本數據的散點圖如圖所示,求得經驗回歸方程為y=b1x+a1,并對變量x,y進行線性相關檢驗,得到樣本相關系數r1,則( ).A.b1>0 B.b1<0 C.a1<0 D.r1>04.為考察某種藥物A對預防疾病B的效果,某機構進行了動物試驗,得到如下列聯表:藥物A 疾病B 合計患病 未患病服用 10 45 55未服用 20 30 50合計 30 75 105由上述數據得出下列結論,其中結論正確的是( ).附:χ2=,其中n=a+b+c+d.α 0.1 0.05 0.01 0.005xα 2.706 3.841 6.635 7.879A.依據α=0.05的獨立性檢驗,認為藥物A對預防疾病B有效B.依據α=0.1的獨立性檢驗,認為藥物A對預防疾病B無效C.依據α=0.01的獨立性檢驗,認為藥物A對預防疾病B有效D.依據α=0.005的獨立性檢驗,認為藥物A對預防疾病B有效5.(改編)一組數據按從小到大的順序排列為1,4,m,12,14,21,則該組數據的第75百分位數是( ).A.14 B.6 C.8 D.126.已知數據x1,x2,…,x5的平均數為4,方差為2,數據y1,y2,…,y5的平均數為2,方差為4,若將這兩組數據混合形成一組新的數據,則新的這組數據的方差為( ).A.6 B.2 C.3 D.47.某地建立農業科技圖書館,供農民免費借閱.經過5年的調查統計,調查人員收集了該圖書館近5年的借閱數據,如下表:年份 2019 2020 2021 2022 2023年份代碼x 1 2 3 4 5年借閱量y/萬冊 4.9 5.1 5.5 5.7 5.8根據上表,可得y關于x的經驗回歸方程為=0.24x+a,則下列說法正確的有( ).A.a=5B.若根據數據作出散點圖,則5個點中至少有1個點在經驗回歸直線上C.y與x的樣本相關系數r>0D.2024年該圖書館的借閱量一定不少于6.12萬冊8.記數據1,2,3,4,5的方差為,數據3,6,9,12,15的方差為,則= .9.(改編)2024年4月24日是第九個“中國航天日”,今年的主題是“極目楚天,共襄星漢”.某校組織學生參與航天知識競答活動,一班8位同學的成績如下:7,6,8,9,8,7,10,m.若去掉m,該組數據的第25百分位數保持不變,則整數m(1≤m≤10)的值可以是 .(寫出一個滿足條件的m值即可)10.某城市地鐵交通建設項目已經基本完成,為了解市民對該項目的滿意度,項目人員分別從不同地鐵站點隨機抽取1 000名市民對該項目進行評分,統計發現評分均在[40,100]內,把評分分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六組,并繪制頻率分布直方圖,如圖所示.下列判斷正確的是( ).A.圖中a的值為0.025B.該次滿意度評分的平均數約為85分C.該次滿意度評分的眾數約為85分D.大約有34%的市民滿意度評分在[60,80)內11.某學習小組對一組數據(xi,yi)(i=1,2,3,…,7)進行回歸分析,甲同學首先求出經驗回歸方程為=5x+4,樣本點的中心為(2,m).乙同學對甲同學的計算過程進行檢查,發現甲將數據(2,3)誤輸成(3,2),將這兩個數據修正后得到經驗回歸方程為=kx+7,則實數k=( ).A. B. C. D.12.已知我國某省的二、三、四線城市數量之比為1∶3∶6.今年3月份調查得知該省的二、三、四線城市房產均價為0.8萬元/平方米,方差為11.其中三、四線城市的房產均價分別為1萬元/平方米,0.5萬元/平方米,三、四線城市房價的方差分別為10,8,則二線城市房產均價為 萬元/平方米,二線城市房價的方差為 .13.(17分)碳中和是指主體在一定時間內產生的二氧化碳或溫室氣體排放總量,通過植樹造林、節能減排等形式,以抵消自身產生的二氧化碳或溫室氣體排放量,實現正負抵消,達到相對“零排放”.如圖,這是本世紀以來,某省的碳排放總量的年度數據散點圖.該數據分為兩段:2010年前該省致力于經濟發展,沒有有效控制碳排放;從2010年開始,該省通過各種舉措有效控制了碳排放.用x表示年份代號,記2010年為x=0.用h表示2010年前的年度碳排放量,y表示2010年開始的年度碳排放量.2011—2017年該省碳排放量年度統計表年份 2011 2012 2013 2014 2015 2016 2017年份代號x 1 2 3 4 5 6 7年度碳排放量y/億噸 2.54 2.635 2.72 2.80 2.885 3.00 3.09(1)若h關于x的經驗回歸方程為=0.125x+2.425,據此估計若未采取措施,2017年該省的碳排放量,并結合表中數據,說明該省在控制碳排放的舉措下減少了多少億噸的碳排放量.(2)根據=0.125x+2.425,設2011—2017年間各年碳排放減少量為zi(zi=-yi),建立z關于x的經驗回歸方程=x2+.①根據=x2+,求表中y關于x的經驗回歸方程(精確到0.001);②根據①所求的經驗回歸方程,估計該省的碳排放量在哪年達到峰值.參考數據:=140,=4 676,zi=23.605,=0.115.參考公式:=,=-.14.(人教A版必修第二冊P224T2改編)五名同學每人各擲一次骰子,分別記錄每次骰子朝上一面的點數,下列選項中,可能出現點數6的是( ).A.中位數為3,眾數為3B.平均數為3,眾數為4C.平均數為3,中位數為3D.平均數為2,方差為2.415.(15分)(原創)2023年3月29日,亞洲圍棋錦標賽開幕式在北京舉行.該比賽為亞洲地區目前規模最大、范圍最廣的洲級圍棋賽事.為了解某中學的高一學生對此新聞事件的關注程度,從該校全體高一學生中隨機抽取了200名學生進行調查,調查樣本中有80名女生.根據樣本的調查結果繪制的等高堆積條形圖(陰影區域表示關注亞洲圍棋錦標賽的部分),如圖所示.(1)完成下面的列聯表,根據小概率值α=0.005的獨立性檢驗,能否據此判斷該中學高一年級學生對亞洲圍棋錦標賽的關注程度與性別有關 關注 沒關注 合計男生女生合計(2)從對比賽關注的學生中,按男女比例采用分層隨機抽樣的方法抽取8人參加該比賽開幕式的活動,并從8人中隨機選出2人分別作為正、副領隊,求所選出的正、副領隊是一男一女的概率.附:χ2=,其中n=a+b+c+d.α 0.05 0.01 0.005 0.001xα 3.841 6.635 7.879 10.828參考答案專題十三 統計題型1 用樣本估計總體考向1 用樣本的頻率分布估計總體分布例1【解析】(1)估計平均年齡為(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)×10=47.9(歲).(2)根據頻率分布直方圖,可估計眾數為45.因為(0.001+0.002+0.012+0.017+0.023)×10>0.5,(0.001+0.002+0.012+0.017)×10<0.5,所以中位數位于區間[40,50)內,設中位數為x,則(0.001+0.002+0.012+0.017)×10+(x-40)×0.023=0.5,解得x≈47.8,所以估計中位數為47.8歲.跟蹤訓練【解析】(1)因為成績落在區間[50,60)內的人數為16,所以樣本容量n==100.由(0.016+x+0.040+0.010+0.004)×10=1,解得x=0.030.(2)估計該市全體學生歷史成績的平均數為0.016×10×55+0.030×10×65+0.040×10×75+0.010×10×85+0.004×10×95=70.6(分),中位數為70+×10=71(分).考向2 統計圖表與數字特征例2 C【解析】對于A, 根據頻數分布表可知, 6+12+18=36<50,所以畝產量的中位數不小于1 050 kg, 故A錯誤;對于B,畝產量不低于1 100 kg的頻數為24+10=34,所以畝產量低于1 100 kg的稻田占比為×100%=66%,故B錯誤;對于C,稻田畝產量的極差最大為1 200-900=300(kg),最小為1 150-950=200(kg),故C正確;對于D,由頻數分布表可得,100塊稻田畝產量的平均值約為×(6×925+12×975+18×1 025+30×1 075+24×1 125+10×1 175)=1 067(kg),故D錯誤.故選C.跟蹤訓練 BC【解析】對于A,由18×25%=4.5,可知這18人年齡的25%分位數為30,故A錯誤;對于B,由18×80%=14.4,可知這18人年齡的80%分位數為40,故B正確;對于C,這18人年齡的中位數是=32(歲),故C正確;對于D,這18人年齡的眾數是32歲,故D錯誤.考向3 數字特征的應用例3【解析】(1)由題意,求出zi的值,如下表所示:試驗 序號i 1 2 3 4 5 6 7 8 9 10zi 9 6 8 -8 15 11 19 18 20 12則=×(9+6+8-8+15+11+19+18+20+12)=11,s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)因為2=2=,=11=>,所以可以認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高.跟蹤訓練【解析】(1)記小組A的數據依次為x1,x2,…,x10,小組B的數據為y1,y2,…,y10,由題意可得A組與B組的平均數分別為=xi=48,=yi=57,兩組的方差分別為=(xi-48)2=13.4,=(yi-57)2=155.4.(2)由于專業人士打分更符合專業規則,所以他們打分的相似程度會更高,由(1)可知<,根據方差越大,數據的波動越大,可知小組A更像是由專業人士組成的.題型2 成對數據的統計分析考向1 相關系數例4【解析】 (1)樣本中10棵這種樹木的根部橫截面積的平均值==0.06(m2),樣本中10棵這種樹木的材積量的平均值==0.39(m3),據此可估計該林區這種樹木平均一棵的根部橫截面積為0.06 m2,平均一棵的材積量為0.39 m3.(2)r====≈≈0.97.(3)設該林區這種樹木的總材積量的估計值為Y m3,由樹木的材積量與其根部橫截面積近似成正比,可得=,解得Y=1 209.故可估計該林區這種樹木的總材積量為1 209 m3.跟蹤訓練【解析】(1)依題意知,yi-=(xi-),則r===·=·=0.65×=≈0.971,可以推斷連續的營業天數x與銷售總量y這兩個變量正線性相關,且相關程度很強.(2)=(xi-)2=(-2xi+)=(-2xi+20)=-=×22 000-=1 100-=200,顯然>0,解得=30,因此=0.65+54.50=0.65×30+54.50=74,所以銷售總量y的平均數為74輛.考向2 一元回歸模型與回歸分析例5【解析】(1)①設經驗回歸方程為=x+,由題意得=×(0+1+2+3+4)=2,=×(4.2+4.1+4.0+3.9+3.8)=4,∴(xi-)(zi-)=(-2)×0.2+(-1)×0.1+0×0+1×(-0.1)+2×(-0.2)=-1,∴(xi-)2=(-2)2+(-1)2+02+12+22=10,則==-0.1,=-=4+0.1×2=4.2,則z關于x的經驗回歸方程為=-0.1x+4.2.②由y=kcx+20(x≥0),得y-20=kcx(x≥0),兩邊取對數得ln(y-20)=ln k+xln c,利用①的結論得ln c=-0.1,ln k=4.2,∴c=e-0.1≈0.9,k=e4.2≈66.7.(2)由(1)得y=66.7×0.9x+20(x≥0),令y=60,得x=log0.90.6≈4.8.∴該品種綠茶用85 ℃的水泡制4.8 min后飲用,口感最佳.跟蹤訓練【解析】(1)根據題圖2可知,模型①的殘差波動性很大,說明擬合關系較差.模型②的殘差波動性相對較小,殘差比較均勻地分布在橫軸的附近,說明擬合關系很好,所以選擇模型②更適宜.(2)①設t=,則y=c+dt,所以===6.3,=-=75-6.3×2.25=60.825,所以y關于x的經驗回歸方程為y=60.825+6.3.②由題設可得L=(111.225-y)=(111.225-6.3-60.825)=-6.3x+50.4,當==4,即x=16時,年利潤L的值最大,故該科技公司2030年的年利潤最大.考向3 獨立性檢驗例6【解析】(1)由表可知抽取的學生中日均體育鍛煉時長不小于1小時的人數占比為=,則估計該地區29 000名學生中,日均體育鍛煉時長不小于1小時的人數為29 000×=12 500.(2)估計該地區初中學生的日均體育鍛煉時長為××139+×191+×179+×43+×28≈0.9(小時).(3)畫出列聯表如下:學業成績 日均體育鍛煉時長 合計[1,2) 其他優秀 45 50 95不優秀 177 308 485合計 222 358 580零假設為H0:學業成績優秀與日均體育鍛煉時長不小于1小時且小于2小時無關.根據2×2列聯表中的數據,經計算得到χ2=≈3.976>3.841.根據小概率值α=0.05的獨立檢驗,我們推斷H0不成立,即有95%的把握認為學業成績優秀與日均體育鍛煉時長不小于1小時且小于2小時有關.跟蹤訓練【解析】(1)零假設為H0:兩種型號疫苗的效果沒有差異.根據表中數據,得χ2==≈0.717<2.706=x0.1,根據小概率值α=0.1的獨立性檢驗,推斷H0成立,故不能認為A型號疫苗比B型號疫苗的效果好.(2)設事件A1=“志愿者第一針接種A型號疫苗產生抗體”,事件A2=“志愿者第二針接種A型號疫苗產生抗體”,事件A=“志愿者最多兩針接種A型號疫苗產生抗體”,所以P(A1)==,P(A2|)=,則P(A)=P(A1)+P()P(A2|)=+1-×=.1.C【解析】對于A,根據頻數分布表可知,50-9=41>50×75%=37.5,故這50個零件的質量的75%分位數一定小于130 g,故A錯誤;對于B,由于各區間段的零件具體的質量數據未知,故眾數無法確定,故B錯誤;對于C,這50個零件的質量的極差最大為140-80=60(g),最小為130-90=40(g),故這50個零件的質量的極差介于40 g至60 g之間,故C正確;對于D,由頻數分布表可得,這50個零件的質量的平均值約為×(3×85+6×95+10×105+12×115+10×125+9×135)=114.4(g),故D錯誤.故選C.2.解析 (1)根據題意可得如下表格:優級品 非優級品甲車間 26 24乙車間 70 30可得χ2===4.687 5,因為3.841<4.687 5<6.635,所以有95%的把握認為甲、乙兩車間產品的優級品率存在差異,沒有99%的把握認為甲,乙兩車間產品的優級品率存在差異.(2)由題意可知,生產線智能化升級改造后,該工廠產品的優級品的頻率為=0.64,用頻率估計概率可得=0.64,又因為升級改造前該工廠產品的優級品率p=0.5,==≈6.124,而n(-p)=150×0.14=21,可知21>3×6.124=18.372,即n(-p)>3,所以可以認為生產線智能化升級改造后,該工廠產品的優級品率提高了.1.D【解析】小唐這7天每天運動時長的平均數為=≠80(min),A錯誤;小唐這7天每天運動時長的極差是100-45=55(min),B錯誤;將小唐這7天每天運動的時長按照從小到大的順序排列為45,58,60,70,80,92,100,則小唐這7天每天運動時長的中位數是70 min,C錯誤;因為7×80%=5.6,所以第80百分位數是第6項數據,即92,D正確.2.ACD【解析】由扇形圖可知,57歲及以上的參保人數最少,A正確;由折線圖可知,18~30歲人群人均參保費用最少,但是由扇形圖知該年齡段參保人數并不是最少的,估算可知,18~30歲人群參保總費用不是最少的,B錯誤;由條形圖可知,C險種參保比例最高,C正確;由扇形圖可知,31歲及以上的參保人群約占總參保人群的80%,D正確.3.B【解析】由散點圖可知,x與y負相關,則b1<0,r1<0,根據圖形走勢可判斷a1>0.4.A【解析】依題意得χ2=≈6.109.∵6.109>3.841=x0.05,∴依據α=0.05的獨立性檢驗,認為藥物A對預防疾病B有效,A正確;∵6.109>2.706=x0.1,∴依據α=0.1的獨立性檢驗,認為藥物A對預防疾病B有效,B錯誤;∵6.109<6.635=x0.01,∴依據α=0.01的獨立性檢驗,認為藥物A對預防疾病B無效,C錯誤;∵6.109<7.879=x0.005,∴依據α=0.005的獨立性檢驗,認為藥物A對預防疾病B無效,D錯誤.5.A【解析】因為6×0.75=4.5,所以根據百分位數的定義,該組數據的第75百分位數是按從小到大的順序排列的第5項數據,即14.6.D【解析】易知新的這組數據的平均數為=3,所以這組新數據的方差s2=×[2+(4-3)2]+×[4+(2-3)2]=4.7.C【解析】由表可知=×(1+2+3+4+5)=3,=×(4.9+5.1+5.5+5.7+5.8)=5.4,所以a=-0.24=5.4-0.24×3=4.68,A錯誤;由A得=0.24x+4.68,把x=1,2,3,4,5分別代入方程可得為4.92,5.16,5.4,5.64,5.88,對比數據可知B錯誤;因為0.24>0,所以y與x的樣本相關系數r>0,C正確;根據經驗回歸方程得出的僅僅是預測值,所以無法確定2024年該圖書館的借閱量,D錯誤.8.9【解析】將數據1,2,3,4,5記為x1,x2,…,x5,數據3,6,9,12,15記為y1,y2,…,y5,則有yi=3xi(i=1,2,…,5),所以=9,即=9.9.7(7,8,9,10中任意一個均可)【解析】若去掉m,將該組數據按從小到大的順序排列,可得6,7,7,8,8,9,10.因為7×0.25=1.75,所以新數據的第25百分位數為第二個數7,所以7,6,8,9,8,7,10,m的第25百分位數為7,而8×0.25=2,所以7為該組數據從小到大排列后的第二個數與第三個數的平均數,所以m(1≤m≤10)的值可以是7或8或9或10.10.ACD【解析】由頻率分布直方圖知0.035+0.020+0.014+0.004+0.002=0.075,由10×(0.075+a)=1,得a=0.025,A正確;因為45×0.02+55×0.04+65×0.14+75×0.20+85×0.35+95×0.25=80.7,所以滿意度的平均數約為80.7分,B錯誤;由頻率分布直方圖可知眾數估計為85分,C正確;(0.014+0.020)×10=0.34,由樣本估計總體可以認為約有34%的市民滿意度評分在[60,80)內,D正確.11.A【解析】由題意可得m=5×2+4=14,即修正前的樣本中心點為(2,14),假設甲輸入的(x1,y1)為(3,2),則3+x2+x3+…+x7=2×7=14,2+y2+y3+…+y7=7×14=98,得x2+x3+…+x7=11,y2+y3+…+y7=96,在改為正確數據后,=×(2+11)=,=×(3+96)=,所以修正后的樣本中心點為,,將點,的坐標代入經驗回歸方程=kx+7,可得=k+7,解得k=.12.2 29.9【解析】設二線城市房產均價為x萬元/平方米,方差為y,因為二、三、四線城市數量之比為1∶3∶6,二、三、四線城市房產均價為0.8萬元/平方米,三、四線城市的房產均價分別為1萬元/平方米,0.5萬元/平方米,所以x+×1+×0.5=0.8,解得x=2,由題意可得×[y+(2-0.8)2]+×[10+(1-0.8)2]+×[8+(0.5-0.8)2]=11,解得y=29.9.13.解析 (1)由經驗回歸方程知,若未采取措施,2017年該省碳排放量的估計值=0.125×7+2.425=3.3(億噸),由此估計減少的碳排放量為3.3-3.09=0.21(億噸). 5分(2)①設x2=t,則==20,=ti,===≈0.004,∴=-=0.115-20×≈0.035, 9分∴=0.004x2+0.035,∴=-=0.125x+2.425-0.004x2-0.035=-0.004x2+0.125x+2.39. 14分②∵函數y=-0.004x2+0.125x+2.39的圖象的對稱軸為直線x==15.625,∴估計在2026年該省的碳排放量達到峰值. 17分14.AC【解析】當擲骰子出現的結果為1,2,3,3,6時,滿足中位數為3,眾數為3,A正確;若平均數為3,且出現點數6,則其余4個數的和為9,而眾數為4,故除6外其余4個數的和至少為11,所以不可能出現點數6,B錯誤;當擲骰子出現的結果為1,1,3,4,6時,滿足平均數為3,中位數為3,C正確;若平均數為2,且出現點數6,則方差s2>×(6-2)2=3.2>2.4,所以當平均數為2,方差為2.4時,一定不會出現點數6,D錯誤.15.解析 (1)由題意得,關注亞洲圍棋錦標賽的男生有(200-80)×0.4=48(人),則不關注亞洲圍棋錦標賽的男生有120-48=72(人);關注亞洲圍棋錦標賽的女生有80×0.2=16(人),則不關注亞洲圍棋錦標賽的女生有80-16=64(人). 3分得到如下列聯表:關注 沒關注 合計男生 48 72 120女生 16 64 80合計 64 136 200零假設為H0:該中學高一年級學生對亞洲圍棋錦標賽的關注程度與性別無關.根據列聯表中的數據,經計算得到χ2=≈8.824>7.879=x0.005,根據小概率值α=0.005的獨立性檢驗,我們推斷H0不成立,即認為該中學高一年級學生對亞洲圍棋錦標賽的關注程度與性別有關.7分(2)采用分層隨機抽樣的方法,從男生中抽取的人數為8×=6,從女生中抽取的人數為8×=2. 10分故所求概率P===. 15分 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫