資源簡介 (共57張PPT)第八章<<<章末復(fù)習(xí)課知識(shí)網(wǎng)絡(luò)一、線性回歸分析二、獨(dú)立性檢驗(yàn)三、數(shù)形結(jié)合思想在獨(dú)立性檢驗(yàn)中的應(yīng)用內(nèi)容索引四、轉(zhuǎn)化與化歸思想在非線性回歸分析中的應(yīng)用線性回歸分析一1.回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法.其基本步驟為通過散點(diǎn)圖和經(jīng)驗(yàn)選擇經(jīng)驗(yàn)回歸方程的類型,然后通過一定的規(guī)則確定出相應(yīng)的經(jīng)驗(yàn)回歸方程,通過一定的方法進(jìn)行檢驗(yàn),最后應(yīng)用于實(shí)際或?qū)憫?yīng)變量進(jìn)行預(yù)測(cè).2.主要培養(yǎng)數(shù)學(xué)建模和數(shù)據(jù)分析的素養(yǎng). 某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動(dòng)物數(shù)量有所增加.為調(diào)查該地區(qū)某種野生動(dòng)物的數(shù)量,將其分成面積相近的200個(gè)地塊,從這些地塊中用簡單隨機(jī)抽樣的方法抽取20個(gè)作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個(gè)樣區(qū)的植物覆蓋面積(單位:公頃)和這例 1種野生動(dòng)物的數(shù)量,并計(jì)算得xi=60,yi=1 200,(xi-)2=80,(yi-)2=9 000,(xi-)(yi-)=800.(1)求該地區(qū)這種野生動(dòng)物數(shù)量的估計(jì)值(這種野生動(dòng)物數(shù)量的估計(jì)值等于樣區(qū)這種野生動(dòng)物數(shù)量的平均數(shù)乘以地塊數(shù));由已知得樣本平均數(shù)為=yi=60,從而該地區(qū)這種野生動(dòng)物數(shù)量的估計(jì)值為60×200=12 000.(2)求樣本(xi,yi)(i=1,2,…,20)的樣本相關(guān)系數(shù)(精確到0.01);附:樣本相關(guān)系數(shù)r=,≈1.414.樣本(xi,yi)(i=1,2,…,20)的樣本相關(guān)系數(shù)為r===≈0.94.(3)根據(jù)現(xiàn)有統(tǒng)計(jì)資料,各地塊間植物覆蓋面積差異很大,為提高樣本的代表性以獲得該地區(qū)這種野生動(dòng)物數(shù)量更準(zhǔn)確的估計(jì),請(qǐng)給出一種你認(rèn)為更合理的抽樣方法,并說明理由.采用比例分配的分層隨機(jī)抽樣,根據(jù)植物覆蓋面積的大小對(duì)地塊分層,再對(duì)200個(gè)地塊進(jìn)行分層隨機(jī)抽樣.理由如下:由(2)知各樣區(qū)的這種野生動(dòng)物數(shù)量與植物覆蓋面積有很強(qiáng)的正相關(guān)關(guān)系.由于各地塊間植物覆蓋面積差異很大,從而各地塊間這種野生動(dòng)物數(shù)量差異也很大,采用分層隨機(jī)抽樣的方法較好地保持了樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致性,提高了樣本的代表性,從而可以獲得該地區(qū)這種野生動(dòng)物數(shù)量更準(zhǔn)確的估計(jì).(1)畫散點(diǎn)圖.根據(jù)已知數(shù)據(jù)畫出散點(diǎn)圖.(2)判斷變量的相關(guān)性并求經(jīng)驗(yàn)回歸方程.通過觀察散點(diǎn)圖,直觀感知兩個(gè)變量是否具有相關(guān)關(guān)系.在此基礎(chǔ)上,利用最小二乘法求,,然后寫出經(jīng)驗(yàn)回歸方程.(3)回歸分析.畫殘差圖或計(jì)算R2,進(jìn)行殘差分析.(4)實(shí)際應(yīng)用.依據(jù)求得的經(jīng)驗(yàn)回歸方程解決實(shí)際問題.反思感悟解決回歸分析問題的一般步驟跟蹤訓(xùn)練 1 下面給出了根據(jù)某市2017年~2023年水果人均占有量y(單位:kg)和年份代碼x繪制的散點(diǎn)圖和經(jīng)驗(yàn)回歸方程的殘差圖(2017年~2023年的年份代碼x分別為1~7).(1)根據(jù)散點(diǎn)圖分析y與x之間的相關(guān)關(guān)系;根據(jù)散點(diǎn)圖可知,點(diǎn)均勻分布在一條直線附近,且隨著x的增大,y增大,故y與x成線性相關(guān),且為正相關(guān).(2)根據(jù)散點(diǎn)圖相應(yīng)數(shù)據(jù)計(jì)算得yi=1 074, xiyi=4 517,求y關(guān)于x的經(jīng)驗(yàn)回歸方程;依題意得,=×=4,=yi=×1 074≈153.43,=≈≈7.89,=-≈153.43-7.89×4=121.87,所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為=7.89x+121.87.(3)根據(jù)經(jīng)驗(yàn)回歸方程的殘差圖,分析經(jīng)驗(yàn)回歸方程的擬合效果.由殘差圖可以看出,殘差對(duì)應(yīng)點(diǎn)分布在水平帶狀區(qū)域內(nèi),且寬度較窄,說明擬合效果較好,經(jīng)驗(yàn)回歸方程的預(yù)測(cè)精度較高.二獨(dú)立性檢驗(yàn)1.獨(dú)立性檢驗(yàn)研究的問題是有多大把握認(rèn)為兩個(gè)分類變量之間有關(guān)系.為此需先列出2×2列聯(lián)表,從表格中可以直觀地得到兩個(gè)分類變量是否有關(guān)系.另外等高堆積條形圖能更直觀地反映兩個(gè)分類變量之間的情況.獨(dú)立性檢驗(yàn)的思想是可以先假設(shè)二者無關(guān)系,求隨機(jī)變量χ2的值,若χ2大于臨界值,則拒絕假設(shè),否則,接受假設(shè).2.通過計(jì)算χ2的值,進(jìn)而分析相關(guān)性結(jié)論的可信程度,提升數(shù)學(xué)運(yùn)算、數(shù)據(jù)分析的素養(yǎng).例 2 某企業(yè)為提高服務(wù)質(zhì)量留住客戶,從運(yùn)營系統(tǒng)中選出300名客戶,對(duì)業(yè)務(wù)水平和服務(wù)水平的評(píng)價(jià)進(jìn)行統(tǒng)計(jì),其中業(yè)務(wù)水平的滿意率為,服務(wù)水平的滿意率為,對(duì)業(yè)務(wù)水平和服務(wù)水平都滿意的客戶有180人.(1)完成2×2列聯(lián)表;業(yè)務(wù)水平 服務(wù)水平 合計(jì)對(duì)服務(wù)水平滿意人數(shù) 對(duì)服務(wù)水平不滿意人數(shù)對(duì)業(yè)務(wù)水平滿意人數(shù) 對(duì)業(yè)務(wù)水平不滿意人數(shù) 合計(jì) 由題意可得對(duì)業(yè)務(wù)水平滿意的有300×=260(人),對(duì)服務(wù)水平滿意的有300×=200(人),2×2列聯(lián)表如下.業(yè)務(wù)水平 服務(wù)水平 合計(jì)對(duì)服務(wù)水平滿意人數(shù) 對(duì)服務(wù)水平不滿意人數(shù)對(duì)業(yè)務(wù)水平滿意人數(shù) 180 80 260對(duì)業(yè)務(wù)水平不滿意人數(shù) 20 20 40合計(jì) 200 100 300(2)依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),能否認(rèn)為業(yè)務(wù)水平與服務(wù)水平有關(guān)?零假設(shè)為H0:業(yè)務(wù)水平與服務(wù)水平無關(guān).計(jì)算得χ2==≈5.769>3.841=x0.05,依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),我們推斷H0不成立,即認(rèn)為業(yè)務(wù)水平與服務(wù)水平有關(guān).(1)獨(dú)立性檢驗(yàn)是一種假設(shè)檢驗(yàn),用于檢驗(yàn)兩個(gè)變量是否相互獨(dú)立,主要依據(jù)是計(jì)算χ2的值,再利用該值與臨界值xα進(jìn)行比較作出判斷.(2)χ2計(jì)算公式較復(fù)雜,計(jì)算時(shí)要細(xì)心.反思感悟 考察小麥種子滅菌跟黑穗病的關(guān)系,經(jīng)試驗(yàn)觀察,得到數(shù)據(jù)如表:跟蹤訓(xùn)練 2依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),能否據(jù)此推斷小麥種子滅菌與發(fā)生黑穗病有關(guān)?黑穗病 種子滅菌情況 合計(jì)種子滅菌 種子未滅菌有黑穗病 26 184 210無黑穗病 50 200 250合計(jì) 76 384 460零假設(shè)為H0:小麥種子滅菌與發(fā)生黑穗病無關(guān).由列聯(lián)表的數(shù)據(jù)可得χ2=≈4.804>3.841=x0.05,根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),我們推斷H0不成立,可以認(rèn)為小麥種子滅菌與發(fā)生黑穗病有關(guān)系.數(shù)形結(jié)合思想在獨(dú)立性檢驗(yàn)中的應(yīng)用三1.數(shù)形結(jié)合思想就是在解決與幾何圖形有關(guān)的問題時(shí),將圖形信息轉(zhuǎn)換成代數(shù)信息,利用數(shù)量特征,將其轉(zhuǎn)化為代數(shù)問題;在進(jìn)行回歸分析時(shí),常利用散點(diǎn)圖、殘差圖等說明線性相關(guān)情況或模型的擬合效果.在獨(dú)立性檢驗(yàn)中,我們常用等高堆積條形圖直觀地反映數(shù)據(jù)的情況,從而可以粗略地判斷兩個(gè)分類變量是否有關(guān)系.2.主要培養(yǎng)數(shù)學(xué)抽象和數(shù)學(xué)運(yùn)算的素養(yǎng). 某機(jī)構(gòu)為了了解患色盲是否與性別有關(guān),隨機(jī)抽取了1 000名成年人進(jìn)行調(diào)查,在調(diào)查的480名男性中有38名患色盲,520名女性中有6名患色盲,分別利用圖形和獨(dú)立性檢驗(yàn)(α=0.001)的方法來判斷患色盲與性別是否有關(guān).例 3根據(jù)題目所給的數(shù)據(jù)作出如下的列聯(lián)表:性別 色盲 合計(jì)患色盲 未患色盲男 38 442 480女 6 514 520合計(jì) 44 956 1 000根據(jù)列聯(lián)表作出相應(yīng)的等高堆積條形圖,如圖所示.圖中兩個(gè)深色條的高分別表示男性和女性患色盲的頻率,從圖中可以看出,男性患色盲的頻率明顯高于女性患色盲的頻率,因此我們可認(rèn)為患色盲與性別有關(guān).零假設(shè)為H0:患色盲與性別無關(guān).根據(jù)列聯(lián)表中所給的數(shù)據(jù),得χ2=≈27.139>10.828=x0.001,根據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),推斷H0不成立,即認(rèn)為患色盲與性別有關(guān),此推斷犯錯(cuò)誤的概率不超過0.001.反思感悟(1)兩個(gè)明確:①明確兩類主體;②明確研究的兩個(gè)問題.(2)兩個(gè)準(zhǔn)確:①準(zhǔn)確畫出2×2列聯(lián)表;②準(zhǔn)確理解χ2.解獨(dú)立性檢驗(yàn)的應(yīng)用問題的關(guān)注點(diǎn) 某電視傳媒公司為了解某地區(qū)電視觀眾對(duì)某類體育節(jié)目的收視情況,隨機(jī)抽取了100名觀眾進(jìn)行調(diào)查.如圖所示的是根據(jù)調(diào)查結(jié)果繪制的觀眾日均收看該體育節(jié)目時(shí)間的頻率分布直方圖.將日均收看該體育節(jié)目時(shí)間不低于40分鐘的觀眾稱為“體育迷”.跟蹤訓(xùn)練 3(1)根據(jù)已知條件完成下面的2×2列聯(lián)表,依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),能否據(jù)此認(rèn)為“體育迷”與性別有關(guān)?性別 “體育迷”情況 合計(jì)非體育迷 體育迷男 女 10 55合計(jì) 附:χ2=,其中n=a+b+c+d.α 0.05 0.01xα 3.841 6.635由頻率分布直方圖可知,在抽取的100人中,“體育迷”有25人,從而2×2列聯(lián)表如下:性別 “體育迷”情況 合計(jì)非體育迷 體育迷男 30 15 45女 45 10 55合計(jì) 75 25 100零假設(shè)為H0:“體育迷”與性別無關(guān).將2×2列聯(lián)表中的數(shù)據(jù)代入公式計(jì)算,得χ2==≈3.030<3.841=x0.05,根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H0不成立,即認(rèn)為“體育迷”與性別無關(guān).(2)將上述調(diào)查所得到的頻率視為概率.現(xiàn)在從該地區(qū)大量電視觀眾中,采用隨機(jī)抽樣方法每次抽取1名觀眾,抽取3次,記被抽取的3名觀眾中的“體育迷”人數(shù)為X.若每次抽取的結(jié)果是相互獨(dú)立的,求X的分布列,均值E(X)和方差D(X).由頻率分布直方圖,知抽到“體育迷”的頻率為0.25,將頻率視為概率,即從觀眾中抽取一名“體育迷”的概率為.由題意知X~B,從而X的分布列為X 0 1 2 3PE(X)=3×=,D(X)=3××=.轉(zhuǎn)化與化歸思想在非線性回歸分析中的應(yīng)用四1.轉(zhuǎn)化與化歸思想主要體現(xiàn)在非線性回歸分析中.在實(shí)際問題中,并非所有的變量關(guān)系均滿足線性關(guān)系,故要選擇適當(dāng)?shù)暮瘮?shù)模型去擬合樣本數(shù)據(jù),再通過代數(shù)變換,把非線性問題線性化.2.主要培養(yǎng)數(shù)學(xué)建模和數(shù)學(xué)運(yùn)算的素養(yǎng). 某公司為研究某種圖書每冊(cè)的成本費(fèi)y(單位:元)與印刷數(shù)量x(單位:千冊(cè))的關(guān)系,收集了一些數(shù)據(jù)并進(jìn)行了初步處理,得到了右面的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.例 4(xi-)2 (xi-)·(yi-) (ui-)2 (ui-)·(yi-)15.25 3.63 0.269 2 085.5 -230.3 0.787 7.049表中ui=,=ui.(1)根據(jù)散點(diǎn)圖判斷y=a+bx與y=c+哪一個(gè)模型更適合作為該圖書每冊(cè)的成本費(fèi)y(單位:元)與印刷數(shù)量x(單位:千冊(cè))的經(jīng)驗(yàn)回歸方程(只要求給出判斷,不必說明理由);由散點(diǎn)圖判斷,y=c+更適合作為該圖書每冊(cè)的成本費(fèi)y(單位:元)與印刷數(shù)量x(單位:千冊(cè))的經(jīng)驗(yàn)回歸方程.(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的經(jīng)驗(yàn)回歸方程(結(jié)果精確到0.01);(xi-)2 (xi-)·(yi-) (ui-)2 (ui-)·(yi-)15.25 3.63 0.269 2 085.5 -230.3 0.787 7.049附:對(duì)于一組數(shù)據(jù)(ω1,υ1),(ω2,υ2),…,(ωn,υn),其經(jīng)驗(yàn)回歸直線=+ω的斜率和截距的最小二乘估計(jì)公式分別為=,=-.令u=,先建立y關(guān)于u的經(jīng)驗(yàn)回歸方程=+u,由于==≈8.96,所以=-·≈3.63-8.96×0.269≈1.22,所以y關(guān)于u的經(jīng)驗(yàn)回歸方程為=1.22+8.96u,所以y關(guān)于x的非線性經(jīng)驗(yàn)回歸方程為=1.22+.(3)若該圖書每冊(cè)的定價(jià)為9.22元,則至少應(yīng)該印刷多少冊(cè)才能使銷售利潤不低于80 000元?(假設(shè)能夠全部售出.結(jié)果精確到1)(xi-)2 (xi-)·(yi-) (ui-)2 (ui-)·(yi-)15.25 3.63 0.269 2 085.5 -230.3 0.787 7.049假設(shè)印刷x千冊(cè),依題意得9.22x-x≥80,解得x≥11.12,所以至少印刷11 120冊(cè)才能使銷售利潤不低于80 000元.反思感悟非線性化的回歸分析問題,畫出已知數(shù)據(jù)的散點(diǎn)圖,選擇跟散點(diǎn)圖擬合得最好的函數(shù)模型進(jìn)行變量代換,作出變換后樣本點(diǎn)的散點(diǎn)圖,用線性回歸模型擬合.光伏發(fā)電是利用太陽能電池及相關(guān)設(shè)備將太陽光能直接轉(zhuǎn)化為電能.近幾年在國內(nèi)出臺(tái)的光伏發(fā)電補(bǔ)貼政策的引導(dǎo)下,某地光伏發(fā)電裝機(jī)量急劇上漲,如表所示:跟蹤訓(xùn)練 4年份 2015年 2016年 2017年 2018年 2019年 2020年 2021年 2022年年份代碼x 1 2 3 4 5 6 7 8新增光伏裝機(jī)量y (兆瓦) 0.4 0.8 1.6 3.1 5.1 7.1 9.7 12.2某位同學(xué)分別用兩種模型:①y=bx2+a,②y=dx+c進(jìn)行擬合,得到相應(yīng)的經(jīng)驗(yàn)回歸方程并進(jìn)行殘差分析,殘差圖如圖所示(注:殘差等于yi-):經(jīng)過計(jì)算得(xi-)(yi-)=72.8,(xi-)2=42,(ti-)(yi-)=686.8,(ti-)2=3 570,其中ti=,=ti.(1)根據(jù)殘差圖,比較模型①②的擬合效果,應(yīng)該選擇哪個(gè)模型?并簡要說明理由.選擇模型①,理由如下:根據(jù)殘差圖可以看出,模型①殘差對(duì)應(yīng)點(diǎn)分布在以橫軸為對(duì) 稱軸,寬度小于1的水平帶狀區(qū)域內(nèi),且模型①的殘差平方和明顯小于模型②,所以模型①的擬合效果相對(duì)較好.(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù)建立y關(guān)于x的經(jīng)驗(yàn)回歸方程,并預(yù)測(cè)該地區(qū)2025年新增光伏裝機(jī)量是多少.(精確到0.01)附:經(jīng)驗(yàn)回歸直線的斜率和截距的最小二乘估計(jì)公式:=,=-.年份 2015年 2016年 2017年 2018年 2019年 2020年 2021年 2022年年份代碼x 1 2 3 4 5 6 7 8新增光伏裝機(jī)量y (兆瓦) 0.4 0.8 1.6 3.1 5.1 7.1 9.7 12.2由(1)知,y關(guān)于x的經(jīng)驗(yàn)回歸方程為=x2+,令t=x2,則=t+.由所給數(shù)據(jù)可得=ti=×(1+4+9+16+25+36+49+64)=25.5,=yi=×(0.4+0.8+1.6+3.1+5.1+7.1+9.7+12.2)=5,則==≈0.19,=-≈5-0.19×25.5≈0.16.所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為=0.19x2+0.16.預(yù)測(cè)該地區(qū)2025年新增光伏裝機(jī)量為=0.19×112+0.16=23.15(兆瓦). 一、線性回歸分析1.回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法.其基本步驟為通過散點(diǎn)圖和經(jīng)驗(yàn)選擇經(jīng)驗(yàn)回歸方程的類型,然后通過一定的規(guī)則確定出相應(yīng)的經(jīng)驗(yàn)回歸方程,通過一定的方法進(jìn)行檢驗(yàn),最后應(yīng)用于實(shí)際或?qū)憫?yīng)變量進(jìn)行預(yù)測(cè).2.主要培養(yǎng)數(shù)學(xué)建模和數(shù)據(jù)分析的素養(yǎng).例1 某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動(dòng)物數(shù)量有所增加.為調(diào)查該地區(qū)某種野生動(dòng)物的數(shù)量,將其分成面積相近的200個(gè)地塊,從這些地塊中用簡單隨機(jī)抽樣的方法抽取20個(gè)作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個(gè)樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動(dòng)物的數(shù)量,并計(jì)算得xi=60,yi=1 200,(xi-)2=80,(yi-)2=9 000,(xi-)(yi-)=800.(1)求該地區(qū)這種野生動(dòng)物數(shù)量的估計(jì)值(這種野生動(dòng)物數(shù)量的估計(jì)值等于樣區(qū)這種野生動(dòng)物數(shù)量的平均數(shù)乘以地塊數(shù));(2)求樣本(xi,yi)(i=1,2,…,20)的樣本相關(guān)系數(shù)(精確到0.01);(3)根據(jù)現(xiàn)有統(tǒng)計(jì)資料,各地塊間植物覆蓋面積差異很大,為提高樣本的代表性以獲得該地區(qū)這種野生動(dòng)物數(shù)量更準(zhǔn)確的估計(jì),請(qǐng)給出一種你認(rèn)為更合理的抽樣方法,并說明理由.附:樣本相關(guān)系數(shù)r=,≈1.414.反思感悟 解決回歸分析問題的一般步驟(1)畫散點(diǎn)圖.根據(jù)已知數(shù)據(jù)畫出散點(diǎn)圖.(2)判斷變量的相關(guān)性并求經(jīng)驗(yàn)回歸方程.通過觀察散點(diǎn)圖,直觀感知兩個(gè)變量是否具有相關(guān)關(guān)系.在此基礎(chǔ)上,利用最小二乘法求,,然后寫出經(jīng)驗(yàn)回歸方程.(3)回歸分析.畫殘差圖或計(jì)算R2,進(jìn)行殘差分析.(4)實(shí)際應(yīng)用.依據(jù)求得的經(jīng)驗(yàn)回歸方程解決實(shí)際問題.跟蹤訓(xùn)練1 下面給出了根據(jù)某市2017年~2023年水果人均占有量y(單位:kg)和年份代碼x繪制的散點(diǎn)圖和經(jīng)驗(yàn)回歸方程的殘差圖(2017年~2023年的年份代碼x分別為1~7).(1)根據(jù)散點(diǎn)圖分析y與x之間的相關(guān)關(guān)系;(2)根據(jù)散點(diǎn)圖相應(yīng)數(shù)據(jù)計(jì)算得yi=1 074, xiyi=4 517,求y關(guān)于x的經(jīng)驗(yàn)回歸方程;(3)根據(jù)經(jīng)驗(yàn)回歸方程的殘差圖,分析經(jīng)驗(yàn)回歸方程的擬合效果.二、獨(dú)立性檢驗(yàn)1.獨(dú)立性檢驗(yàn)研究的問題是有多大把握認(rèn)為兩個(gè)分類變量之間有關(guān)系.為此需先列出2×2列聯(lián)表,從表格中可以直觀地得到兩個(gè)分類變量是否有關(guān)系.另外等高堆積條形圖能更直觀地反映兩個(gè)分類變量之間的情況.獨(dú)立性檢驗(yàn)的思想是可以先假設(shè)二者無關(guān)系,求隨機(jī)變量χ2的值,若χ2大于臨界值,則拒絕假設(shè),否則,接受假設(shè).2.通過計(jì)算χ2的值,進(jìn)而分析相關(guān)性結(jié)論的可信程度,提升數(shù)學(xué)運(yùn)算、數(shù)據(jù)分析的素養(yǎng).例2 某企業(yè)為提高服務(wù)質(zhì)量留住客戶,從運(yùn)營系統(tǒng)中選出300名客戶,對(duì)業(yè)務(wù)水平和服務(wù)水平的評(píng)價(jià)進(jìn)行統(tǒng)計(jì),其中業(yè)務(wù)水平的滿意率為,服務(wù)水平的滿意率為,對(duì)業(yè)務(wù)水平和服務(wù)水平都滿意的客戶有180人.(1)完成2×2列聯(lián)表;業(yè)務(wù)水平 服務(wù)水平 合計(jì)對(duì)服務(wù)水平 滿意人數(shù) 對(duì)服務(wù)水平 不滿意人數(shù)對(duì)業(yè)務(wù)水平 滿意人數(shù)對(duì)業(yè)務(wù)水平 不滿意人數(shù)合計(jì)(2)依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),能否認(rèn)為業(yè)務(wù)水平與服務(wù)水平有關(guān)?反思感悟 (1)獨(dú)立性檢驗(yàn)是一種假設(shè)檢驗(yàn),用于檢驗(yàn)兩個(gè)變量是否相互獨(dú)立,主要依據(jù)是計(jì)算χ2的值,再利用該值與臨界值xα進(jìn)行比較作出判斷.(2)χ2計(jì)算公式較復(fù)雜,計(jì)算時(shí)要細(xì)心.跟蹤訓(xùn)練2 考察小麥種子滅菌跟黑穗病的關(guān)系,經(jīng)試驗(yàn)觀察,得到數(shù)據(jù)如表:黑穗病 種子滅菌情況 合計(jì)種子滅菌 種子未滅菌有黑穗病 26 184 210無黑穗病 50 200 250合計(jì) 76 384 460依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),能否據(jù)此推斷小麥種子滅菌與發(fā)生黑穗病有關(guān)?三、數(shù)形結(jié)合思想在獨(dú)立性檢驗(yàn)中的應(yīng)用1.數(shù)形結(jié)合思想就是在解決與幾何圖形有關(guān)的問題時(shí),將圖形信息轉(zhuǎn)換成代數(shù)信息,利用數(shù)量特征,將其轉(zhuǎn)化為代數(shù)問題;在進(jìn)行回歸分析時(shí),常利用散點(diǎn)圖、殘差圖等說明線性相關(guān)情況或模型的擬合效果.在獨(dú)立性檢驗(yàn)中,我們常用等高堆積條形圖直觀地反映數(shù)據(jù)的情況,從而可以粗略地判斷兩個(gè)分類變量是否有關(guān)系.2.主要培養(yǎng)數(shù)學(xué)抽象和數(shù)學(xué)運(yùn)算的素養(yǎng).例3 某機(jī)構(gòu)為了了解患色盲是否與性別有關(guān),隨機(jī)抽取了1 000名成年人進(jìn)行調(diào)查,在調(diào)查的480名男性中有38名患色盲,520名女性中有6名患色盲,分別利用圖形和獨(dú)立性檢驗(yàn)(α=0.001)的方法來判斷患色盲與性別是否有關(guān).反思感悟 解獨(dú)立性檢驗(yàn)的應(yīng)用問題的關(guān)注點(diǎn)(1)兩個(gè)明確:①明確兩類主體;②明確研究的兩個(gè)問題.(2)兩個(gè)準(zhǔn)確:①準(zhǔn)確畫出2×2列聯(lián)表;②準(zhǔn)確理解χ2.跟蹤訓(xùn)練3 某電視傳媒公司為了解某地區(qū)電視觀眾對(duì)某類體育節(jié)目的收視情況,隨機(jī)抽取了100名觀眾進(jìn)行調(diào)查.如圖所示的是根據(jù)調(diào)查結(jié)果繪制的觀眾日均收看該體育節(jié)目時(shí)間的頻率分布直方圖.將日均收看該體育節(jié)目時(shí)間不低于40分鐘的觀眾稱為“體育迷”.(1)根據(jù)已知條件完成下面的2×2列聯(lián)表,依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),能否據(jù)此認(rèn)為“體育迷”與性別有關(guān)?性別 “體育迷”情況 合計(jì)非體育迷 體育迷男女 10 55合計(jì)(2)將上述調(diào)查所得到的頻率視為概率.現(xiàn)在從該地區(qū)大量電視觀眾中,采用隨機(jī)抽樣方法每次抽取1名觀眾,抽取3次,記被抽取的3名觀眾中的“體育迷”人數(shù)為X.若每次抽取的結(jié)果是相互獨(dú)立的,求X的分布列,均值E(X)和方差D(X).附:χ2=,其中n=a+b+c+d.α 0.05 0.01xα 3.841 6.635四、轉(zhuǎn)化與化歸思想在非線性回歸分析中的應(yīng)用1.轉(zhuǎn)化與化歸思想主要體現(xiàn)在非線性回歸分析中.在實(shí)際問題中,并非所有的變量關(guān)系均滿足線性關(guān)系,故要選擇適當(dāng)?shù)暮瘮?shù)模型去擬合樣本數(shù)據(jù),再通過代數(shù)變換,把非線性問題線性化.2.主要培養(yǎng)數(shù)學(xué)建模和數(shù)學(xué)運(yùn)算的素養(yǎng).例4 某公司為研究某種圖書每冊(cè)的成本費(fèi)y(單位:元)與印刷數(shù)量x(單位:千冊(cè))的關(guān)系,收集了一些數(shù)據(jù)并進(jìn)行了初步處理,得到了下面的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.(xi-)2 (xi-)·(yi-) (ui-)2 (ui-)·(yi-)15.25 3.63 0.269 2 085.5 -230.3 0.787 7.049表中ui=,=ui.(1)根據(jù)散點(diǎn)圖判斷y=a+bx與y=c+哪一個(gè)模型更適合作為該圖書每冊(cè)的成本費(fèi)y(單位:元)與印刷數(shù)量x(單位:千冊(cè))的經(jīng)驗(yàn)回歸方程(只要求給出判斷,不必說明理由);(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的經(jīng)驗(yàn)回歸方程(結(jié)果精確到0.01);(3)若該圖書每冊(cè)的定價(jià)為9.22元,則至少應(yīng)該印刷多少冊(cè)才能使銷售利潤不低于80 000元?(假設(shè)能夠全部售出.結(jié)果精確到1)附:對(duì)于一組數(shù)據(jù)(ω1,υ1),(ω2,υ2),…,(ωn,υn),其經(jīng)驗(yàn)回歸直線=+ω的斜率和截距的最小二乘估計(jì)公式分別為=,=-.反思感悟 非線性化的回歸分析問題,畫出已知數(shù)據(jù)的散點(diǎn)圖,選擇跟散點(diǎn)圖擬合得最好的函數(shù)模型進(jìn)行變量代換,作出變換后樣本點(diǎn)的散點(diǎn)圖,用線性回歸模型擬合.跟蹤訓(xùn)練4 光伏發(fā)電是利用太陽能電池及相關(guān)設(shè)備將太陽光能直接轉(zhuǎn)化為電能.近幾年在國內(nèi)出臺(tái)的光伏發(fā)電補(bǔ)貼政策的引導(dǎo)下,某地光伏發(fā)電裝機(jī)量急劇上漲,如表所示:年份 2015年 2016年 2017年 2018年 2019年 2020年 2021年 2022年年份代碼x 1 2 3 4 5 6 7 8新增光伏裝機(jī)量y(兆瓦) 0.4 0.8 1.6 3.1 5.1 7.1 9.7 12.2某位同學(xué)分別用兩種模型:①y=bx2+a,②y=dx+c進(jìn)行擬合,得到相應(yīng)的經(jīng)驗(yàn)回歸方程并進(jìn)行殘差分析,殘差圖如圖所示(注:殘差等于yi-):經(jīng)過計(jì)算得(xi-)(yi-)=72.8,(xi-)2=42,(ti-)(yi-)=686.8,(ti-)2=3 570,其中ti=,=ti.(1)根據(jù)殘差圖,比較模型①②的擬合效果,應(yīng)該選擇哪個(gè)模型?并簡要說明理由.(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù)建立y關(guān)于x的經(jīng)驗(yàn)回歸方程,并預(yù)測(cè)該地區(qū)2025年新增光伏裝機(jī)量是多少.(精確到0.01)附:經(jīng)驗(yàn)回歸直線的斜率和截距的最小二乘估計(jì)公式:=,=-.答案精析例1 解 (1) 由已知得樣本平均數(shù)為=yi=60,從而該地區(qū)這種野生動(dòng)物數(shù)量的估計(jì)值為60×200=12 000.(2)樣本(xi,yi)(i=1,2,…,20)的樣本相關(guān)系數(shù)為r===≈0.94.(3)采用比例分配的分層隨機(jī)抽樣,根據(jù)植物覆蓋面積的大小對(duì)地塊分層,再對(duì)200個(gè)地塊進(jìn)行分層隨機(jī)抽樣.理由如下:由(2)知各樣區(qū)的這種野生動(dòng)物數(shù)量與植物覆蓋面積有很強(qiáng)的正相關(guān)關(guān)系.由于各地塊間植物覆蓋面積差異很大,從而各地塊間這種野生動(dòng)物數(shù)量差異也很大,采用分層隨機(jī)抽樣的方法較好地保持了樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致性,提高了樣本的代表性,從而可以獲得該地區(qū)這種野生動(dòng)物數(shù)量更準(zhǔn)確的估計(jì).跟蹤訓(xùn)練1 解 (1)根據(jù)散點(diǎn)圖可知,點(diǎn)均勻分布在一條直線附近,且隨著x的增大,y增大,故y與x成線性相關(guān),且為正相關(guān).(2)依題意得,=×=4,=yi=×1 074≈153.43,=≈≈7.89,=-≈153.43-7.89×4=121.87,所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為=7.89x+121.87.(3)由殘差圖可以看出,殘差對(duì)應(yīng)點(diǎn)分布在水平帶狀區(qū)域內(nèi),且寬度較窄,說明擬合效果較好,經(jīng)驗(yàn)回歸方程的預(yù)測(cè)精度較高.例2 解 (1)由題意可得對(duì)業(yè)務(wù)水平滿意的有300×=260(人),對(duì)服務(wù)水平滿意的有300×=200(人),2×2列聯(lián)表如下.業(yè)務(wù)水平 服務(wù)水平 合計(jì)對(duì)服務(wù)水平滿意人數(shù) 對(duì)服務(wù)水平 不滿意人數(shù)對(duì)業(yè)務(wù)水平滿意人數(shù) 180 80 260對(duì)業(yè)務(wù)水平不滿意人數(shù) 20 20 40合計(jì) 200 100 300(2)零假設(shè)為H0:業(yè)務(wù)水平與服務(wù)水平無關(guān).計(jì)算得χ2==≈5.769>3.841=x0.05,依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),我們推斷H0不成立,即認(rèn)為業(yè)務(wù)水平與服務(wù)水平有關(guān).跟蹤訓(xùn)練2 解 零假設(shè)為H0:小麥種子滅菌與發(fā)生黑穗病無關(guān).由列聯(lián)表的數(shù)據(jù)可得χ2=≈4.804>3.841=x0.05,根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),我們推斷H0不成立,可以認(rèn)為小麥種子滅菌與發(fā)生黑穗病有關(guān)系.例3 解 根據(jù)題目所給的數(shù)據(jù)作出如下的列聯(lián)表:性別 色盲 合計(jì)患色盲 未患色盲男 38 442 480女 6 514 520合計(jì) 44 956 1 000根據(jù)列聯(lián)表作出相應(yīng)的等高堆積條形圖,如圖所示.圖中兩個(gè)深色條的高分別表示男性和女性患色盲的頻率,從圖中可以看出,男性患色盲的頻率明顯高于女性患色盲的頻率,因此我們可認(rèn)為患色盲與性別有關(guān).零假設(shè)為H0:患色盲與性別無關(guān).根據(jù)列聯(lián)表中所給的數(shù)據(jù),得χ2=≈27.139>10.828=x0.001,根據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),推斷H0不成立,即認(rèn)為患色盲與性別有關(guān),此推斷犯錯(cuò)誤的概率不超過0.001.跟蹤訓(xùn)練3 解 (1)由頻率分布直方圖可知,在抽取的100人中,“體育迷”有25人,從而2×2列聯(lián)表如下:性別 “體育迷”情況 合計(jì)非體育迷 體育迷男 30 15 45女 45 10 55合計(jì) 75 25 100零假設(shè)為H0:“體育迷”與性別無關(guān).將2×2列聯(lián)表中的數(shù)據(jù)代入公式計(jì)算,得χ2==≈3.030<3.841=x0.05,根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H0不成立,即認(rèn)為“體育迷”與性別無關(guān).(2)由頻率分布直方圖,知抽到“體育迷”的頻率為0.25,將頻率視為概率,即從觀眾中抽取一名“體育迷”的概率為.由題意知X~B,從而X的分布列為X 0 1 2 3PE(X)=3×=,D(X)=3××=.例4 解 (1)由散點(diǎn)圖判斷,y=c+更適合作為該圖書每冊(cè)的成本費(fèi)y(單位:元)與印刷數(shù)量x(單位:千冊(cè))的經(jīng)驗(yàn)回歸方程.(2)令u=,先建立y關(guān)于u的經(jīng)驗(yàn)回歸方程=+u,由于==≈8.96,所以=-·≈3.63-8.96×0.269≈1.22,所以y關(guān)于u的經(jīng)驗(yàn)回歸方程為=1.22+8.96u,所以y關(guān)于x的非線性經(jīng)驗(yàn)回歸方程為=1.22+.(3)假設(shè)印刷x千冊(cè),依題意得9.22x-x≥80,解得x≥11.12,所以至少印刷11 120冊(cè)才能使銷售利潤不低于80 000元.跟蹤訓(xùn)練4 解 (1)選擇模型①,理由如下:根據(jù)殘差圖可以看出,模型①殘差對(duì)應(yīng)點(diǎn)分布在以橫軸為對(duì) 稱軸,寬度小于1的水平帶狀區(qū)域內(nèi),且模型①的殘差平方和明顯小于模型②,所以模型①的擬合效果相對(duì)較好.(2)由(1)知,y關(guān)于x的經(jīng)驗(yàn)回歸方程為=x2+,令t=x2,則=t+.由所給數(shù)據(jù)可得=ti=×(1+4+9+16+25+36+49+64)=25.5,=yi=×(0.4+0.8+1.6+3.1+5.1+7.1+9.7+12.2)=5,則==≈0.19,=-≈5-0.19×25.5≈0.16.所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為=0.19x2+0.16.預(yù)測(cè)該地區(qū)2025年新增光伏裝機(jī)量為=0.19×112+0.16=23.15(兆瓦). 展開更多...... 收起↑ 資源列表 章末復(fù)習(xí)課(導(dǎo)學(xué)案,含答案).docx 第八章 章末復(fù)習(xí)課.pptx 縮略圖、資源來源于二一教育資源庫