中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

人教A版數學(選擇性必修三講義)第20講8.2一元線性回歸模型及其應用(8.2.1一元線性回歸模型+8.2.2一元線性回歸模型參數的最小二乘法估計)(學生版+解析)

資源下載
  1. 二一教育資源

人教A版數學(選擇性必修三講義)第20講8.2一元線性回歸模型及其應用(8.2.1一元線性回歸模型+8.2.2一元線性回歸模型參數的最小二乘法估計)(學生版+解析)

資源簡介

第02講 8.2 一元線性回歸模型及其應用
(8.2.1一元線性回歸模型+8.2.2一元線性回歸模型參數的最小二乘法估計)
課程標準 學習目標
①了解一元線性回歸模型的含義,理解兩 個變量之間隨機關系的一元線性回歸模型的作用與意義。 ②了解殘差在線性回歸與非線性回歸問 題的作用及意義。 ③了解一元線性回歸模型參數與最小二 乘估計的推導過程,理解最小二乘估計的原理。 ④會結合題意求一元線性回歸方程。 ⑤會用相關指數進行分析模型擬合的效 果情況.。 通過本節課的學習,要求會求一元線性回歸方程,會進行殘差分析,能判斷回歸模型的擬合效果,能利用樣本數據建立統計模型并能進行預測
知識點1:一元線性回歸模型
(1)一元線性回歸模型
我們稱
為關于的一元線性回歸模型,其中稱為因變量或響應變量,稱為自變量或解釋變量;和為模型的未知參數,稱為截距參數,稱為斜率參數;是與之間的隨機誤差.
(2)隨機誤差
在線性回歸模型中,和為模型的未知參數,是與之間的誤差,通常為隨機變量,稱為隨機誤差.它的均值,方程.
線性回歸模型的完整表達式為 , 在此模型中,隨機誤差的方差越小,用預報真實值的精度越高.
知識點2:一元線性回歸模型參數的最小二乘法
(1)經驗回歸方程的求解法:最小二乘法
回歸直線方程過樣本點的中心,是回歸直線方程最常用的一個特征;
我們將稱為關于的線性回歸方程,也稱經驗回歸函數或經驗回歸公式,其圖形稱為經驗回歸直線。這種求經驗回歸方程的方法叫做最小二乘法,求得的,叫做,的最小二乘估計,其中稱為回歸系數,它實際上也就是經驗回歸直線的斜率,為截距.
其中
【即學即練1】(2024上·全國·高三專題練習)某校數學建模學生社團進行了一項實驗研究,采集了的一組數據如下表所示:
2 3 4 5 6 7
52.5 45 40 30 25 17.5
該社團對上述數據進行了分析,發現與之間具有線性相關關系.
(1)畫出表中數據的散點圖,并指出與之間的相關系數是正還是負;
(2)求出關于的線性回歸方程,并寫出當時,預測數據的值.
附:在線性回歸方程中,,其中為樣本平均值.
【答案】(1)散點圖見解析,負
(2),
【詳解】(1)由題意得散點圖如圖所示:
由圖可知與之間成負相關關系,所以是負.
(2)因為,,
,,
所以,,
∴關于線性回歸方程為,
所以當時,.
(2)求經驗回歸方程的步驟
①作出散點圖,判斷兩變量是否具有線性相關關系,若具有線性相關關系,則可求其經驗回歸方程;
②列表求出,的值;
③利用公式先計算,再根據經驗回歸直線過樣本點的中心計算;
④寫出經驗回歸方程.
求經驗回歸方程,關鍵在于正確求出系數,,由于計算量較大,所以計算時要仔細謹慎、分層進行,避免因計算產生錯誤要特別注意,只有兩個變量呈線性相關關系時,求出的經驗回歸方程才有意義.
(3)經驗回歸方程的性質
①經驗回歸直線一定過點,點通常稱為樣本點的中心;
②一次函數的單調性由的符號決定,函數遞增的充要條件是;函數遞減的充要條件是.這說明:與正相關的充要條件是;與負相關的充要條件是.
③在經驗回歸方程中,是經驗回歸直線的斜率,是截距.一般地,當回歸系數時,說明兩個變量呈正相關關系,它的意義是當每增大一個單位時,平均增大個單位;當時,說明兩個變量呈負相關關系,它的意義是當每增大一個單位時,平均減小個單位.
知識點3:殘差
(1)殘差
對于響應變量,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的稱為預測值,觀測值減去預測值稱為殘差.
(2)殘差圖
作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數據,或體重估計值等,這樣作出的圖形稱為殘差圖.若殘差點比較均勻地落在水平的帶狀區域內,帶狀區域越窄,則說明擬合效果越好.
(3)殘差分析
殘差是隨機誤差的估計結果,通過殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差分析.其步驟為:計算殘差化殘差圖在殘差圖中分析殘差特性.
【即學即練2】(2024·全國·高三專題練習)對于一組具有線性相關關系的樣本數據,其樣本中心為,回歸方程為,則相應于樣本點的殘差為( )
A. B.
C. D.
【答案】C
【詳解】因為殘差是實際觀察值與估計值(擬合值)之間的差,所以相應于樣本點的殘差為,
故選:C.
知識點4:決定系數
(1)殘差平方和
殘差平方和,殘差平方和越小,模型擬合效果越好,殘差平方和越大,模型擬合效果越差.
(2)決定系數
決定系數是度量模型擬合效果的一種指標,在線性模型中,它代表解釋變量客戶預報變量的能力.
,越大,即擬合效果越好,越小,模型擬合效果越差.
【即學即練3】(2023下·青海西寧·高二校考階段練習)甲、乙、丙、丁四位同學在建立變量x,y的回歸模型時,分別選擇了4種不同模型,計算可得它們的相關指數R2分別如下表:
甲 乙 丙 丁
R2 0.98 0.78 0.50 0.85
建立的回歸模型擬合效果最好的同學是 .
【答案】選甲 相關指數R2越大,表示回歸模型擬合效果越好.
【詳解】相關指數 越大,相關性越強,回歸模型擬合效果越好,所以效果最好的是甲.
(3)決定系數與相關系數的聯系與區別
①相關系數反映兩個變量的相關關系的強弱及正相關或負相關,決定系數反映回歸模型的擬合效果.
②在含有一個解釋變量的線性模型中,決定系數的數值是相關系數的平方,其變化范圍為,而相關系數的變化范圍為.
③當相關系數接近于1時,說明兩變量的相關性較強,當接近于0時,說明兩變量的相關性較弱;而當接近于1時,說明經驗回歸方程的擬合效果較好.
題型01由散點圖判斷是否線性相關
【典例1】(2023下·河南南陽·高二唐河縣第一高級中學校考階段練習)2003年春季,我國部分地區SARS流行,黨和政府采取果斷措施,防治結合,很快使病情得到控制,下表是某同學記載的5月1日至5月12日每天北京市SARS治愈者數據,以及根據這些數據繪制出的散點圖
日期 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 5.10 5.11 5.12
人數 100 109 115 118 121 134 141 152 168 175 186 203
下列說法:①根據此散點圖,可以判斷日期與人數具有線性相關關系;②根據此散點圖,可以判斷日期與人數具有一次函數關系.其中正確的個數為( )
A.0個 B.1個 C.2個 D.以上都不對
【典例2】(2023·全國·高二專題練習)某個男孩的年齡與身高的統計數據如下表所示:
年齡x(歲) 1 2 3 4 5 6
身高y(cm) 78 87 98 108 115 120
(1)畫出散點圖;
(2)判斷y與x是否具有線性相關關系,如果相關,是正相關還是負相關.
【變式1】(2023下·高二課時練習)下列四個圖中,兩個變量x,y具有線性相關關系的是( )
A.①② B.①②④ C.②③④ D.②④
題型02求回歸直線方程
【典例1】(2024上·江西贛州·高二統考期末)大氣污染物(直徑不大于2.5的顆粒物)的濃度超過一定限度會影響人的身體健康.為研究濃度y(單位:)與汽車流量x(單位:千輛)的線性關系,研究人員選定了10個城市,在每個城市建立交通監測點,統計了24h內過往的汽車流量以及同時段空氣中的濃度,得到如下數據:
城市編號 1 2 3 4 5 6 7 8 9 10 總和
x 1.300 1.444 0.786 1.652 1.756 1.754 1.200 1.500 1.200 0.908 13.5
y 66 76 21 170 156 120 72 120 100 129 1030
并計算得,,.
(1)求變量關于的線性回歸方程;
(2)根據內濃度確定空氣質量等級,濃度在0~35為優,35~75為良,75~115為輕度污染,115~150為中度污染,150~250為重度污染,已知某城市內過往的汽車流量為1360輛,判斷該城市的空氣質量等級.
參考公式:線性回歸方程為,其中以.
【典例2】(2024上·重慶沙坪壩·高三重慶八中校考階段練習)在入室盜竊類案件中,出現頻率最高的痕跡物證之一就是足跡. 負重行走對足跡步伐特征影響的規律強,而且較為穩定. 正在行走的人在負重的同時,步長變短,步寬變大,步角變大. 因此, 以身高分別為170cm, 175cm, 180cm的人員各 20名作為實驗對象,讓他們采取雙手胸前持重物的負重方式行走,得到實驗對象在負重0kg,5kg,10kg,15kg,20kg狀態下相對穩定的步長數據平均值. 并在不同身高情況下,建立足跡步長s(單位:cm)關于負重x(單位:kg)的三個經驗回歸方程. 根據身高 170cm組數據建立線性回歸方程①: ;根據身高 175cm組數據建立線性回歸方程②: 根據身高 180cm 組數據建立線性回歸方程③: .
(1)根據身高 180cm組的統計數據,求,的值,并解釋參數的含義;
身高 180cm不同負重情況下的步長數據平均值
負重x/kg 0 5 10 15 20
足跡步長s/cm 74.35 73.50 71.80 68.60 65.75
(2)在一起盜竊案中,被盜竊物品重為9kg,在現場勘查過程中,測量得犯罪嫌疑人往返時足跡步長的差值為4.464cm,推測該名嫌疑人的身高,并說明理由.
附: .為回歸方程, ,,,
【典例3】(2024上·全國·高三專題練習)某種產品的廣告費支出x(單位:萬元)與銷售額y(萬元)之間有如下一組數據:
廣告費支出x 2 4 5 6 8
銷售額y 30 40 60 50 70
(1)求出樣本點中心
(2)求回歸直線方程(其中,)
【變式1】(2024上·黑龍江牡丹江·高三牡丹江市第二高級中學校聯考期末)近期,一些地方中小學生“課間10分鐘”問題受到社會廣泛關注,國家號召中小學要增加學生的室外活動時間.但是進入12月后,天氣漸冷,很多學生因氣溫低而減少了外出活動次數.為了解本班情況,一位同學統計了一周(5天)的氣溫變化和某一固定課間該班級的學生出樓人數,得到如下數據:
溫度(零下) 7 10 11 15 17
出樓人數 20 16 17 10 7
(1)利用最小二乘法,求變量之間的線性回歸方程;
附:用最小二乘法求線性回歸方程的系數:   
(2)預測當溫度為時,該班級在本節課間的出樓人數(人數:四舍五入取整數).
(3)為了號召學生能夠增加室外活動時間,學校舉行拔河比賽,采取3局2勝制(無平局).在甲、乙兩班的較量中,甲班每局獲勝的概率均為,設隨機變量X表示甲班獲勝的局數,求的分布列和期望.
【變式2】(2024上·全國·高三專題練習)下面給出了根據我國年年水果人均占有量(單位:)和年份代碼繪制的散點圖(年年的年份代碼分別為).

(1)根據散點圖分析與之間的相關關系;
(2)根據散點圖相應數據計算得,,求關于的線性回歸方程.(精確到)
附:回歸方程中斜率和截距的最小二乘估計公式分別為:

【變式3】(2024·全國·高三專題練習)在一次抽樣調查中測得個樣本點,得到下表及散點圖.
(1)根據散點圖判斷與哪一個適宜作為關于的回歸方程;(給出判斷即可,不必說明理由)
(2)根據(1)的判斷結果試建立與的回歸方程;(計算結果保留整數)
參考公式:
題型03求樣本中心(根據樣本中心求參數)
【典例1】(2024上·全國·高三專題練習)具有線性相關關系的變量的一組數據如下:
x 0 1 2 3
y -5 -4.5 -4.2 -3.5
其線性回歸直線方程為,則回歸直線經過( )
A.第一、二、三象限 B.第二、三、四象限
C.第一、二、四象限 D.第一、三、四象限
【典例2】(2024下·全國·高二隨堂練習)已知取表中的數值,若具有線性相關關系,線性回歸方程為,則=( )
0 1 3 4
a 4.3 4.8 6.7
A.2.2 B.2.4 C.2.5 D.2.6
【典例3】(2024下·全國·高二隨堂練習)某公司一種型號的產品近期銷售情況如表:
月份 2 3 4 5 6
銷售額(萬元) 15.1 16.3 17.0 17.2 18.4
根據上表可得到回歸直線方程,據此估計,該公司7月份這種型號產品的銷售額為( )
A.18.85萬元 B.19.3萬元 C.19.25萬元 D.19.05萬元
【典例4】(多選)(2024上·浙江寧波·高三統考期末)某電商平臺為了對某一產品進行合理定價,采用不同的單價在平臺試銷,得到的數據如下表所示:
單價x/元 8 8.5 9 9.5 10
銷量y/萬件 89 85 80 78 68
根據以上數據得到與具有較強的線性關系,若用最小二乘估計得到經驗回歸方程為,則( )
A.相關系數 B.點一定在經驗回歸直線上
C. D.時,對應銷量的殘差為
【變式1】(2024上·四川綿陽·高二綿陽南山中學實驗學校校考期末)已知x與y之間的一組數據:
x 0 1 2 3
y 1 3 5 7
則y與x的線性回歸方程為必過點 ( )
A.(2,2) B.(1.5,0)
C.(1.5,4) D.(1, 2)
【變式2】(2024上·重慶·高三重慶巴蜀中學校考期中)已知變量x,γ呈線性相關關系,回歸方程為,且變量x,y的樣本數據如下表所示
x -2 -1 0 1 2
y 5 4 m 2 1
據此計算出在時,預測值為-0.2,則m的值為( )
A.3 B.2.8 C.2 D.1
【變式3】(2024下·全國·高二隨堂練習)變量x,y的數據如下所示:
x 5 4 3 2 1
y 2 1.5 1 1 0.5
回歸直線恒過點 .
【變式4】(2024上·全國·高三專題練習)某地建立了農業科技圖書館,供農民免費借閱,收集了近5年的借閱數據如下表:
年份 2019 2020 2021 2022 2023
年份代碼 1 2 3 4 5
年借閱量萬冊 4.9 5.1 5.5 5.7 5.8
根據上表,可得關于的線性回歸方程為.則 .
題型04根據回歸直線方程估計數據
【典例1】(2024上·黑龍江齊齊哈爾·高三校聯考期末)已知在特定的時期內某人在一個月內每天投入的體育鍛煉時間(分鐘)與一個月內減輕的體重(斤)的一組數據如表所示:
30 40 50 60 70
一個月內減輕的體重與每天投入的體育鍛煉時間之間具有較強的線性相關關系,其線性回歸直線方程是,據此模型估計當此人在一個月內每天投入的體育鍛煉時間為90分鐘時,該月內減輕的體重約為( )
A.斤 B.斤 C.斤 D.斤
【典例2】(2024下·全國·高二隨堂練習)某科學興趣小組的同學認為生物都是由蛋白質構成的,高溫可以使蛋白質變性失活,于是想初步探究某微生物的成活率與溫度的關系,微生物數量(個)與溫度的部分數據如下表:
溫度 4 8 10 18
微生物數量(個) 30 22 18 14
由表中數據算得回歸方程為,預測當溫度為時,微生物數量為 個.
【變式1】(2024上·全國·高三專題練習)如果在一次實驗中,測得的五組數值如下表所示,經計算知,y對x的線性回歸方程是,預測當時,( )
x 0 1 2 3 4
y 10 15 20 30 35
A.73.5 B.74 C.74.5 D.75
【變式2】(2024上·全國·高三專題練習)牛膝是莧科多年生藥用草本植物,具有活血通經、補肝腎、強筋骨等功效,可用于治療腰膝酸痛等癥狀.某農戶種植牛膝的時間(單位:天)和牛膝的根部直徑(單位:)的統計表如下:
20 30 40 50 60
0.8 1.3 2.2 3.3 4.5
由上表可得經驗回歸方程為,若此農戶準備在時采收牛膝,據此模型預測,此批牛滕采收時間預計是第 天.
題型05殘差計算
【典例1】(2024·全國·高三專題練習)已知一組樣本數據,,,,根據這組數據的散點圖分析與之間的線性相關關系,若求得其線性回歸方程為,則在樣本點處的殘差為( )
A.38.1 B.22.6 C. D.91.1
【典例2】(2024·云南楚雄·云南省楚雄彝族自治州民族中學校考一模)對具有線性相關關系的變量有一組觀測數據(),其經驗回歸方程為,且,,則相應于點的殘差為 .
【典例3】(2023·全國·高二專題練習)隨機選取變量和變量的對觀測數據,選取的第對觀測數據記為,其數值對應如下表所示:
編號
計算得:,,,,.
(1)求變量和變量的樣本相關系數(小數點后保留位),判斷這兩個變量是正相關還是負相關,并推斷它們的線性相關程度;
(2)假設變量關于的一元線性回歸模型為.
(ⅰ)求關于的經驗回歸方程,并預測當時的值;
(ⅱ)設為時該回歸模型的殘差,求、、、、的方差.
參考公式:,,.
【變式1】(2024·全國·高三專題練習)根據一組樣本數據,,,的散點圖分析x與y之間是否存在線性相關關系,求得其線性回歸方程為,則在樣本點處的殘差為( )
A. B. C. D.
【變式2】(2024·全國·高三專題練習)從某大學中隨機選取8名女大學生,其身高x(單位:cm)與體重y(單位:kg)數據如下表:
x 165 165 157 170 175 165 155 170
y 48 57 50 54 64 61 43 59
若已知y與x的線性回歸方程為,設殘差記為觀測值與預測值之間的差(即殘差)那么選取的女大學生身高為175cm時,相應的殘差為 .
【變式3】(2023·高二課時練習)高中女學生的身高預報體重的回歸方程是(其中,的單位分別是cm,kg),則此方程在樣本點處的殘差是 .
題型06相關指數計算
【典例1】(2024上·全國·高三期末)2021年6月17日9時22分,我國酒泉衛星發射中心用長征2F遙十二運載火箭,成功將神舟十二號載人飛船送入預定軌道,順利將聶海勝 劉伯明 湯洪波3名航天員送入太空,發射取得圓滿成功,這標志著中國人首次進入自己的空間站.某公司負責生產的A型材料是神舟十二號的重要零件,該材料應用前景十分廣泛.該公司為了將A型材料更好地投入商用,擬對A型材料進行應用改造.根據市場調研與模擬,得到應用改造投入x(億元)與產品的直接收益y(億元)的數據統計如下表:建立了y與x的兩個回歸模型:模型①:,
模型②:;
序號 1 2 3 4 5 6 7
x 2 3 4 6 8 10 13
y 15 22 27 40 48 54 60
(1)根據表格中的數據,比較模型①,②的相關指數的大小;
(2)據(2)選擇擬合精度更高 更可靠的模型,預測對A型材料進行應用改造的投入為17億元時的直接收益.
附:刻畫回歸效果的相關指數,且當越大時,回歸方程的擬合效果越好..
回歸模型 模型① 模型②
79.31 20.2
【典例2】(2023·全國·高二專題練習)已知與之間的數據如下表:
(1)求關于的線性回歸方程;(2)完成下面的殘差表:
并判斷(1)中線性回歸方程的回歸效果是否良好(若,則認為回歸效果良好).附:,,,.
【典例3】(2021下·山東青島·高二統考期中)現代物流成為繼勞動力、自然資源外影響企業生產成本及利潤的重要因素.某企業去年前八個月的物流成本和企業利潤的數據(單位:萬元)如下表所示:
月份
物流成本
利潤
殘差
根據最小二乘法公式求得線性回歸方程為.
(1)求的值,并利用已知的線性回歸方程求出月份對應的殘差值;
(2)請先求出線性回歸模型的決定系數(精確到);若根據非線性模型求得解釋變量(物流成本)對于響應變量(利潤)決定系數,請說明以上兩種模型哪種模型擬合效果更好?
(3)通過殘差分析,懷疑殘差絕對值最大的那組數據有誤,經再次核實后發現其真正利潤應該為萬元.請重新根據最小二乘法的思想與公式,求出新的線性回歸方程.
附1(修正前的參考數據):
,,,.
附2:.
附3:,.
【變式1】(2022下·寧夏·高二六盤山高級中學校考階段練習)有一組統計數據和,根據數據建立了如下的兩個模型:①,②.通過殘差分析發現第①個線性模型比第②個線性模型擬合效果好.若分別是相關指數和殘差平方和,則下列結論正確的是 .①>,②<,③<,④>.
【變式2】(2023上·重慶·高三重慶八中校考階段練習)混凝土的抗壓強度x較容易測定,而抗剪強度y不易測定,工程中希望建立一種能由x推算y的經驗公式,下表列出了現有的9對數據,分別為,,…,.
x 141 152 168 182 195 204 223 254 277
y 23.1 24.2 27.2 27.8 28.7 31.4 32.5 34.8 36.2
以成對數據的抗壓強度x為橫坐標,抗剪強度y為縱坐標作出散點圖,如圖所示.
(1)從上表中任選2個成對數據,求該樣本量為2的樣本相關系數r.結合r值分析,由簡單隨機抽樣得到的成對樣本數據的樣本相關系數是否一定能確切地反映變量之間的線性相關關系?
(2)根據散點圖,我們選擇兩種不同的函數模型作為回歸曲線,根據一元線性回歸模型及最小二乘法,得到經驗回歸方程分別為:①,②.經驗回歸方程①和②的殘差計算公式分別為,,.
(ⅰ)求;
(ⅱ)經計算得經驗回歸方程①和②的殘差平方和分別為,,經驗回歸方程①的決定系數,求經驗回歸方程②的決定系數.
附:相關系數,決定系數,.
【變式3】(2023·廣東汕頭·統考二模)車胎凹槽深度是影響汽車剎車的因素,汽車行駛會導致輪胎胎面磨損.某實驗室通過試驗測得行駛里程與某品牌輪胎凹槽深度的數據如下:
行駛里程/萬km 0.00 0.64 1.29 1.93 2.57 3.22 3.86 4.51 5.15
輪胎凹槽深度/mm 10.02 8.37 7.39 6.48 5.82 5.20 4.55 4.16 3.82
以行駛里程為橫坐標、輪胎凹槽深度為縱坐標作散點圖,如圖所示.
(1)根據散點圖,可認為散點集中在直線附近,由此判斷行駛里程與輪胎凹槽深度線性相關,并計算得如下數據,請求出行駛里程與輪胎凹槽深度的相關系數(保留兩位有效數字),并推斷它們線性相關程度的強弱;
2.57 6.20 115.10 29.46
附:相關系數
(2)通過散點圖,也可認為散點集中在曲線附近,考慮使用對數回歸模型,并求得經驗回歸方程及該模型的決定系數.已知(1)中的線性回歸模型為,在同一坐標系作出這兩個模型,據圖直觀回答:哪個模型的擬合效果更好?并用決定系數驗證你的觀察所得.
附:線性回歸模型中,決定系數等于相關系數的平方,即.
A夯實基礎 B能力提升
A夯實基礎
一、單選題
1.(2024·四川綿陽·統考二模)已知變量x,y之間的線性回歸方程為,且變量x,y之間的一組相關數據如表所示,
x 2 4 6 8
y 5 8.2 13 m
則下列說法正確的是( )
A.
B.變量y與x是負相關關系
C.該回歸直線必過點
D.x增加1個單位,y一定增加2個單位
2.(2024上·全國·高三專題練習)變量,之間有如下對應數據:
4 4.5 5.5 6
12 11 10
已知變量對呈線性相關關系,且回歸方程為,則的值是( )
A.10 B.9 C.8 D.7
3.(2024上·全國·高三期末)某同學在研究變量之間的相關關系時,得到以下數據:并采用最小二乘法得到了線性回歸方程,則( )
4.8 5.8 7 8.3 9.1
2.8 4.1 7.2 9.1 11.8
A. B. C. D.
4.(2024·全國·高三專題練習)下列四幅殘差分析圖中,與一元線性回歸模型擬合精度最高的是( )
A. B.
C. D.
5.(2024下·全國·高二隨堂練習)一組成對數據樣本中心點為,由這組數據擬合的線性回歸方程為,用最小二乘法求回歸方程是為了使( )最小.
A.總偏差平方和 B.殘差平方和
C.回歸平方和 D.豎直距離和
6.(2024·全國·高三專題練習)為研究每平方米平均建筑費用與樓層數的關系,某開發商收集了一棟住宅樓在建筑過程中,建筑費用的相關信息,將總樓層數與每平米平均建筑成本(單位:萬元)的數據整理成如圖所示的散點圖:
則下面四個回歸方程類型中最適宜作為每平米平均建筑費用和樓層數的回歸方程類型的是( )
A. B.
C. D.
7.(2024上·山東濱州·高三統考期末)某學校一同學研究溫差(單位:℃)與本校當天新增感冒人數(單位:人)的關系,該同學記錄了5天的數據:
5 6 8 9 12
16 20 25 28 36
由上表中數據求得溫差與新增感冒人數滿足經驗回歸方程,則下列結論不正確的是( )
A.與有正相關關系 B.經驗回歸直線經過點
C. D.時,殘差為0.2
8.(2024上·全國·高三專題練習)已知一組成對數據中y關于x的一元非線性回歸方程,已知,則( )
A. B.1 C. D.
二、多選題
9.(2024·全國·模擬預測)下列有關回歸分析的結論中,正確的有( )
A.若回歸方程為,則變量y與x負相關
B.運用最小二乘法求得的經驗回歸直線一定經過樣本點的中心
C.若決定系數的值越接近于1,表示回歸模型的擬合效果越好
D.若散點圖中所有點都在直線上,則相關系數
10.(2024上·廣東揭陽·高三統考期末)2023年入冬以來,流感高發,某醫院統計了一周中連續5天的流感就診人數y與第天的數據如表所示.
x 1 2 3 4 5
y 21 10a 15a 90 109
根據表中數據可知x,y具有較強的線性相關關系,其經驗回歸方程為,則( )
A.樣本相關系數在內 B.當時,殘差為-2
C.點一定在經驗回歸直線上 D.第6天到該醫院就診人數的預測值為130
三、填空題
11.(2024上·廣東深圳·高三統考期末)某同學收集了變量,的相關數據如下:
x 0.5 2 3 3.5 4 5
y 15
為了研究,的相關關系,他由最小二乘法求得關于的線性回歸方程為,經驗證回歸直線正好經過樣本點,則 .
12.(2023·高二單元測試)下列關于回歸分析的說法正確的是 (填上所有正確說法的序號)
①相關系數越小,兩個變量的相關程度越弱;
②殘差平方和越大的模型,擬合效果越好;
③用相關指數來刻畫回歸效果時,越小,說明模型的擬合效果越好;
④用最小二乘法求回歸直線方程,是尋求使取最小值時的、的值;
⑤在殘差圖中,殘差點比較均勻地落在水平的帶狀區域內,說明選用的模型比較合適,這樣的帶狀區域的寬度越窄,模型擬合精度越高.
四、解答題
13.(2023上·遼寧沈陽·高二校考期末)某班社會實踐小組在寒假去書店體驗圖書銷售員工作,并對某圖書定價x(元)與當天銷量y(本/天)之間的關系進行調查,得到了一組數據,發現變量大致呈線性關系,數據如下表所示
定價x(元) 6 8 10 12
銷量y(本/天) 14 11 8 7
參考數據:,
參考公式:回歸方程中斜率的最小二乘估計值公式為
(1)根據以上數據,求出y關于x的回歸直線方程;
(2)根據回歸直線方程,預測當該圖書每天的銷量為4本時,該圖書的定價是多少元?
14.(2023上·黑龍江雞西·高三雞西市第一中學校校考期末)直播帶貨是一種直播和電商相結合的銷售手段,目前已被廣大消費者所接受.針對這種現狀,某公司決定逐月加大直播帶貨的投入,直播帶貨金額穩步提升,以下是該公司2023年前5個月的帶貨金額:
月份 1 2 3 4 5
帶貨金額萬元 350 440 580 700 880
(1)計算變量的相關系數(結果精確到0.01).
(2)求變量之間的線性回歸方程,并據此預測2023年6月份該公司的直播帶貨金額.
參考數據:,
參考公式:相關系數,線性回歸方程的斜率,截距.
B能力提升
15.(2023上·河南焦作·高二博愛縣第一中學校考期中)已知高三某學生為了迎接高考,參加了學校的5次模擬考試,其中5次的模擬考試成績如表所示,
次數(x) 1 2 3 4 5
考試成績(y) 498 499 497 501 505
設變量x,y滿足回歸直線方程.
(1)假如高考也符合上述的模擬考試的回歸直線方程,高考看作第10次模擬考試,預測2024年的高考的成績;
(2)從上面的5次考試成績中隨機抽取3次,其中2次成績都大于500分的概率.
參考公式:回歸直線方程中的斜率和截距的最小二乘估計公式分別為,.
16.(2023·全國·模擬預測)2015—2019年,中國社會消費品零售額占GDP的比重超過4種,2020年后,中國社會消費品零售額占GDP的比重逐年下降.下表為2018—2022年中國社會消費品零售額(單位:萬億元)及其占GDP的比重y(單位:%)的數據,其中2018—2022年對應的年份代碼x依次為1~5.
年份代碼x 1 2 3 4 5
社會消費品零售額 37.8 40.8 39.2 44.1 44.0
社會消費品零售額占 GDP的比重y/% 41.3 41.5 39.0 38.6 36.7
(1)由上表數據,是否可用一元線性回歸模型擬合y與x的關系,請用相關系數加以說明.
(2)請建立y關于x的一元線性回歸方程.
(3)從2018—2022年中國社會消費品零售額這5個數據中隨機抽取2個數據.若抽取的2個數據中至少有1個數據大于40.0,求這2個數據恰好有1個數據不小于44.0的概率.
附:,,,,
相關系數.
對于一組數據,其一元線性回歸直線的斜率和截距的最小二乘估計公式分別為,.
17.(2023上·云南昆明·高三校考階段練習)云南省統計局發布《全省旅游業發展情況(2015-2022年)》報告,其中2015年至2022年游客總人數y(單位:億人次)的數據如下表:
年份 2015 2016 2017 2018 2019 2020 2021 2022
年份代號x 1 2 3 4 5 6 7 8
游客總人數y 3.3 4.3 5.7 6.9 8.1 5.3 6.5 8.4
為了預測2023年云南省游客總人數,根據2015年至2022年游客總人數y的數據建立線性回歸模型一,得到回歸方程:,但由于受到2020年疫情影響,估計預測不準確,若用2015年至2019年數據建立線性回歸模型二,得到回歸方程:
(1)根據和預測2023年云南省游客總人數(預測數據精確到0.1);
(2)為了檢驗兩種模型的預測效果,對兩種模型作殘差分析得到:
模型一:總偏差平方和,殘差平方和;
模型二:總偏差平方和,殘差平方和,
用來比較模型一與模型二的擬合效果(精確到0.001);
(3)根據2020年至2022年游客總人數y的數據建立線性回歸模型三,求回歸方程,并根據預測2023年云南省游客總人數(預測數據精確到0.1).
參考公式:,,,.
21世紀教育網(www.21cnjy.com)
第02講 8.2 一元線性回歸模型及其應用
(8.2.1一元線性回歸模型+8.2.2一元線性回歸模型參數的最小二乘法估計)
課程標準 學習目標
①了解一元線性回歸模型的含義,理解兩 個變量之間隨機關系的一元線性回歸模型的作用與意義。 ②了解殘差在線性回歸與非線性回歸問 題的作用及意義。 ③了解一元線性回歸模型參數與最小二 乘估計的推導過程,理解最小二乘估計的原理。 ④會結合題意求一元線性回歸方程。 ⑤會用相關指數進行分析模型擬合的效 果情況.。 通過本節課的學習,要求會求一元線性回歸方程,會進行殘差分析,能判斷回歸模型的擬合效果,能利用樣本數據建立統計模型并能進行預測
知識點1:一元線性回歸模型
(1)一元線性回歸模型
我們稱
為關于的一元線性回歸模型,其中稱為因變量或響應變量,稱為自變量或解釋變量;和為模型的未知參數,稱為截距參數,稱為斜率參數;是與之間的隨機誤差.
(2)隨機誤差
在線性回歸模型中,和為模型的未知參數,是與之間的誤差,通常為隨機變量,稱為隨機誤差.它的均值,方程.
線性回歸模型的完整表達式為 , 在此模型中,隨機誤差的方差越小,用預報真實值的精度越高.
知識點2:一元線性回歸模型參數的最小二乘法
(1)經驗回歸方程的求解法:最小二乘法
回歸直線方程過樣本點的中心,是回歸直線方程最常用的一個特征;
我們將稱為關于的線性回歸方程,也稱經驗回歸函數或經驗回歸公式,其圖形稱為經驗回歸直線。這種求經驗回歸方程的方法叫做最小二乘法,求得的,叫做,的最小二乘估計,其中稱為回歸系數,它實際上也就是經驗回歸直線的斜率,為截距.
其中
【即學即練1】(2024上·全國·高三專題練習)某校數學建模學生社團進行了一項實驗研究,采集了的一組數據如下表所示:
2 3 4 5 6 7
52.5 45 40 30 25 17.5
該社團對上述數據進行了分析,發現與之間具有線性相關關系.
(1)畫出表中數據的散點圖,并指出與之間的相關系數是正還是負;
(2)求出關于的線性回歸方程,并寫出當時,預測數據的值.
附:在線性回歸方程中,,其中為樣本平均值.
【答案】(1)散點圖見解析,負
(2),
【詳解】(1)由題意得散點圖如圖所示:
由圖可知與之間成負相關關系,所以是負.
(2)因為,,
,,
所以,,
∴關于線性回歸方程為,
所以當時,.
(2)求經驗回歸方程的步驟
①作出散點圖,判斷兩變量是否具有線性相關關系,若具有線性相關關系,則可求其經驗回歸方程;
②列表求出,的值;
③利用公式先計算,再根據經驗回歸直線過樣本點的中心計算;
④寫出經驗回歸方程.
求經驗回歸方程,關鍵在于正確求出系數,,由于計算量較大,所以計算時要仔細謹慎、分層進行,避免因計算產生錯誤要特別注意,只有兩個變量呈線性相關關系時,求出的經驗回歸方程才有意義.
(3)經驗回歸方程的性質
①經驗回歸直線一定過點,點通常稱為樣本點的中心;
②一次函數的單調性由的符號決定,函數遞增的充要條件是;函數遞減的充要條件是.這說明:與正相關的充要條件是;與負相關的充要條件是.
③在經驗回歸方程中,是經驗回歸直線的斜率,是截距.一般地,當回歸系數時,說明兩個變量呈正相關關系,它的意義是當每增大一個單位時,平均增大個單位;當時,說明兩個變量呈負相關關系,它的意義是當每增大一個單位時,平均減小個單位.
知識點3:殘差
(1)殘差
對于響應變量,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的稱為預測值,觀測值減去預測值稱為殘差.
(2)殘差圖
作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數據,或體重估計值等,這樣作出的圖形稱為殘差圖.若殘差點比較均勻地落在水平的帶狀區域內,帶狀區域越窄,則說明擬合效果越好.
(3)殘差分析
殘差是隨機誤差的估計結果,通過殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差分析.其步驟為:計算殘差化殘差圖在殘差圖中分析殘差特性.
【即學即練2】(2024·全國·高三專題練習)對于一組具有線性相關關系的樣本數據,其樣本中心為,回歸方程為,則相應于樣本點的殘差為( )
A. B.
C. D.
【答案】C
【詳解】因為殘差是實際觀察值與估計值(擬合值)之間的差,所以相應于樣本點的殘差為,
故選:C.
知識點4:決定系數
(1)殘差平方和
殘差平方和,殘差平方和越小,模型擬合效果越好,殘差平方和越大,模型擬合效果越差.
(2)決定系數
決定系數是度量模型擬合效果的一種指標,在線性模型中,它代表解釋變量客戶預報變量的能力.
,越大,即擬合效果越好,越小,模型擬合效果越差.
【即學即練3】(2023下·青海西寧·高二校考階段練習)甲、乙、丙、丁四位同學在建立變量x,y的回歸模型時,分別選擇了4種不同模型,計算可得它們的相關指數R2分別如下表:
甲 乙 丙 丁
R2 0.98 0.78 0.50 0.85
建立的回歸模型擬合效果最好的同學是 .
【答案】選甲 相關指數R2越大,表示回歸模型擬合效果越好.
【詳解】相關指數 越大,相關性越強,回歸模型擬合效果越好,所以效果最好的是甲.
(3)決定系數與相關系數的聯系與區別
①相關系數反映兩個變量的相關關系的強弱及正相關或負相關,決定系數反映回歸模型的擬合效果.
②在含有一個解釋變量的線性模型中,決定系數的數值是相關系數的平方,其變化范圍為,而相關系數的變化范圍為.
③當相關系數接近于1時,說明兩變量的相關性較強,當接近于0時,說明兩變量的相關性較弱;而當接近于1時,說明經驗回歸方程的擬合效果較好.
題型01由散點圖判斷是否線性相關
【典例1】(2023下·河南南陽·高二唐河縣第一高級中學校考階段練習)2003年春季,我國部分地區SARS流行,黨和政府采取果斷措施,防治結合,很快使病情得到控制,下表是某同學記載的5月1日至5月12日每天北京市SARS治愈者數據,以及根據這些數據繪制出的散點圖
日期 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 5.10 5.11 5.12
人數 100 109 115 118 121 134 141 152 168 175 186 203
下列說法:①根據此散點圖,可以判斷日期與人數具有線性相關關系;②根據此散點圖,可以判斷日期與人數具有一次函數關系.其中正確的個數為( )
A.0個 B.1個 C.2個 D.以上都不對
【答案】B
【詳解】由題意,
做出散點圖如下圖所示,

由圖可知,
日期與人數具有線性相關關系,但不是一次函數關系,
①正確,②錯誤,
故選:B.
【典例2】(2023·全國·高二專題練習)某個男孩的年齡與身高的統計數據如下表所示:
年齡x(歲) 1 2 3 4 5 6
身高y(cm) 78 87 98 108 115 120
(1)畫出散點圖;
(2)判斷y與x是否具有線性相關關系,如果相關,是正相關還是負相關.
【答案】(1)答案見解析
(2)y與x具有線性相關關系,且是正相關關系.
【詳解】(1)散點圖如圖所示:

(2)由圖知,所有數據點接近一條直線排列,因此,認為y與x具有線性相關關系,且是正相關關系.
【變式1】(2023下·高二課時練習)下列四個圖中,兩個變量x,y具有線性相關關系的是( )
A.①② B.①②④ C.②③④ D.②④
【答案】D
【詳解】由圖可知,②④中的點集中在一條直線的附近,所以圖②④中的兩個變量具有線性相關關系,
故選:D.
題型02求回歸直線方程
【典例1】(2024上·江西贛州·高二統考期末)大氣污染物(直徑不大于2.5的顆粒物)的濃度超過一定限度會影響人的身體健康.為研究濃度y(單位:)與汽車流量x(單位:千輛)的線性關系,研究人員選定了10個城市,在每個城市建立交通監測點,統計了24h內過往的汽車流量以及同時段空氣中的濃度,得到如下數據:
城市編號 1 2 3 4 5 6 7 8 9 10 總和
x 1.300 1.444 0.786 1.652 1.756 1.754 1.200 1.500 1.200 0.908 13.5
y 66 76 21 170 156 120 72 120 100 129 1030
并計算得,,.
(1)求變量關于的線性回歸方程;
(2)根據內濃度確定空氣質量等級,濃度在0~35為優,35~75為良,75~115為輕度污染,115~150為中度污染,150~250為重度污染,已知某城市內過往的汽車流量為1360輛,判斷該城市的空氣質量等級.
參考公式:線性回歸方程為,其中以.
【答案】(1)
(2)輕度污染
【詳解】(1)由題意得,
又因為,
所以
所以
所以變量y關于x的線性回歸方程為.
(2)當輛千輛時,可得
因為
所以該城市的空氣質量等級為輕度污染.
【典例2】(2024上·重慶沙坪壩·高三重慶八中校考階段練習)在入室盜竊類案件中,出現頻率最高的痕跡物證之一就是足跡. 負重行走對足跡步伐特征影響的規律強,而且較為穩定. 正在行走的人在負重的同時,步長變短,步寬變大,步角變大. 因此, 以身高分別為170cm, 175cm, 180cm的人員各 20名作為實驗對象,讓他們采取雙手胸前持重物的負重方式行走,得到實驗對象在負重0kg,5kg,10kg,15kg,20kg狀態下相對穩定的步長數據平均值. 并在不同身高情況下,建立足跡步長s(單位:cm)關于負重x(單位:kg)的三個經驗回歸方程. 根據身高 170cm組數據建立線性回歸方程①: ;根據身高 175cm組數據建立線性回歸方程②: 根據身高 180cm 組數據建立線性回歸方程③: .
(1)根據身高 180cm組的統計數據,求,的值,并解釋參數的含義;
身高 180cm不同負重情況下的步長數據平均值
負重x/kg 0 5 10 15 20
足跡步長s/cm 74.35 73.50 71.80 68.60 65.75
(2)在一起盜竊案中,被盜竊物品重為9kg,在現場勘查過程中,測量得犯罪嫌疑人往返時足跡步長的差值為4.464cm,推測該名嫌疑人的身高,并說明理由.
附: .為回歸方程, ,,,
【答案】(1),,參數的含義詳見解析
(2)嫌疑人身高為175cm,理由詳見解析
【詳解】(1)由題意可知:,,,
所以,;
的含義表示,負重每增加足跡步長減少.
(2)設被盜竊物品重為9kg時,身高170cm的步長誤差為,高175cm的步長誤差為,高180cm的步長誤差為,
由題意可得,,,,
因為與測量得犯罪嫌疑人往返時足跡步長的差值最接近,
所以犯罪嫌疑人身高為175cm.
【典例3】(2024上·全國·高三專題練習)某種產品的廣告費支出x(單位:萬元)與銷售額y(萬元)之間有如下一組數據:
廣告費支出x 2 4 5 6 8
銷售額y 30 40 60 50 70
(1)求出樣本點中心
(2)求回歸直線方程(其中,)
【答案】(1)
(2)
【詳解】(1)由題意可得:,

所以樣本點中心為.
(2)由題意可得:,

所以,,
所以回歸直線方程為.
【變式1】(2024上·黑龍江牡丹江·高三牡丹江市第二高級中學校聯考期末)近期,一些地方中小學生“課間10分鐘”問題受到社會廣泛關注,國家號召中小學要增加學生的室外活動時間.但是進入12月后,天氣漸冷,很多學生因氣溫低而減少了外出活動次數.為了解本班情況,一位同學統計了一周(5天)的氣溫變化和某一固定課間該班級的學生出樓人數,得到如下數據:
溫度(零下) 7 10 11 15 17
出樓人數 20 16 17 10 7
(1)利用最小二乘法,求變量之間的線性回歸方程;
附:用最小二乘法求線性回歸方程的系數:   
(2)預測當溫度為時,該班級在本節課間的出樓人數(人數:四舍五入取整數).
(3)為了號召學生能夠增加室外活動時間,學校舉行拔河比賽,采取3局2勝制(無平局).在甲、乙兩班的較量中,甲班每局獲勝的概率均為,設隨機變量X表示甲班獲勝的局數,求的分布列和期望.
【答案】(1)
(2)19
(3)分布列見解析;期望為
【詳解】(1),
,
,
,,
回歸直線方程為.
(2)當時,(人),
所以,預測當溫度為時,該班級在本節課間的出樓人數為19人.
(3)隨機變量可取0,1,2.
,
,
,
所以的分布列為:
0 1 2
p
所以的數學期望為.
【變式2】(2024上·全國·高三專題練習)下面給出了根據我國年年水果人均占有量(單位:)和年份代碼繪制的散點圖(年年的年份代碼分別為).

(1)根據散點圖分析與之間的相關關系;
(2)根據散點圖相應數據計算得,,求關于的線性回歸方程.(精確到)
附:回歸方程中斜率和截距的最小二乘估計公式分別為:

【答案】(1)與之間是正相關關系
(2)
【詳解】(1)由散點圖可以看出,散點大致分布在某一直線的附近,且當由小變大時,也由小變大,
與之間是正相關關系.
(2)由表格數據得:,,
,,
關于的線性回歸方程為.
【變式3】(2024·全國·高三專題練習)在一次抽樣調查中測得個樣本點,得到下表及散點圖.
(1)根據散點圖判斷與哪一個適宜作為關于的回歸方程;(給出判斷即可,不必說明理由)
(2)根據(1)的判斷結果試建立與的回歸方程;(計算結果保留整數)
參考公式:
【答案】(1)
(2)
【詳解】(1)由題中散點圖可以判斷,適宜作為關于的回歸方程;
(2)令,則,原數據變為
由表可知與近似具有線性相關關系,計算得,


所以,,則.
所以關于的回歸方程是.
題型03求樣本中心(根據樣本中心求參數)
【典例1】(2024上·全國·高三專題練習)具有線性相關關系的變量的一組數據如下:
x 0 1 2 3
y -5 -4.5 -4.2 -3.5
其線性回歸直線方程為,則回歸直線經過( )
A.第一、二、三象限 B.第二、三、四象限
C.第一、二、四象限 D.第一、三、四象限
【答案】D
【詳解】解:由圖表中的數據知:x,y呈正相關,
所以,
又,
則樣本中心為,在第四象限,
所以回歸直線經過第一、三、四象限,
故選:D
【典例2】(2024下·全國·高二隨堂練習)已知取表中的數值,若具有線性相關關系,線性回歸方程為,則=( )
0 1 3 4
a 4.3 4.8 6.7
A.2.2 B.2.4 C.2.5 D.2.6
【答案】A
【詳解】由題意可知:,,
所以樣本中心為,
代入回歸方程有:,解得.
故選:.
【典例3】(2024下·全國·高二隨堂練習)某公司一種型號的產品近期銷售情況如表:
月份 2 3 4 5 6
銷售額(萬元) 15.1 16.3 17.0 17.2 18.4
根據上表可得到回歸直線方程,據此估計,該公司7月份這種型號產品的銷售額為( )
A.18.85萬元 B.19.3萬元 C.19.25萬元 D.19.05萬元
【答案】D
【詳解】由表中數據可得,,
因為回歸直線過樣本點的中心,所以,解得,
所以回歸直線方程為,
則該公司7月份這種型號產品的銷售額為萬元.
故選:D
【典例4】(多選)(2024上·浙江寧波·高三統考期末)某電商平臺為了對某一產品進行合理定價,采用不同的單價在平臺試銷,得到的數據如下表所示:
單價x/元 8 8.5 9 9.5 10
銷量y/萬件 89 85 80 78 68
根據以上數據得到與具有較強的線性關系,若用最小二乘估計得到經驗回歸方程為,則( )
A.相關系數 B.點一定在經驗回歸直線上
C. D.時,對應銷量的殘差為
【答案】BC
【詳解】由表中數據可得,
所以樣本中心為,故在經驗回歸直線上,B正確,
由可得與具負相關,故A錯誤,
將代入可得,解得,C正確,
當時,,所以殘差為,D錯誤,
故選:BC
【變式1】(2024上·四川綿陽·高二綿陽南山中學實驗學校校考期末)已知x與y之間的一組數據:
x 0 1 2 3
y 1 3 5 7
則y與x的線性回歸方程為必過點 ( )
A.(2,2) B.(1.5,0)
C.(1.5,4) D.(1, 2)
【答案】C
【詳解】由已知,,
所以回歸直線一定過中心點.
故選:C.
【變式2】(2024上·重慶·高三重慶巴蜀中學校考期中)已知變量x,γ呈線性相關關系,回歸方程為,且變量x,y的樣本數據如下表所示
x -2 -1 0 1 2
y 5 4 m 2 1
據此計算出在時,預測值為-0.2,則m的值為( )
A.3 B.2.8 C.2 D.1
【答案】C
【詳解】由題意知回歸方程為過點,則,
即;
又,,
由于回歸方程為必過樣本中心點,
故,
故選:C
【變式3】(2024下·全國·高二隨堂練習)變量x,y的數據如下所示:
x 5 4 3 2 1
y 2 1.5 1 1 0.5
回歸直線恒過點 .
【答案】
【詳解】變量的平均值為,變量的平均值為,
故回歸直線恒過點.
故答案為:.
【變式4】(2024上·全國·高三專題練習)某地建立了農業科技圖書館,供農民免費借閱,收集了近5年的借閱數據如下表:
年份 2019 2020 2021 2022 2023
年份代碼 1 2 3 4 5
年借閱量萬冊 4.9 5.1 5.5 5.7 5.8
根據上表,可得關于的線性回歸方程為.則 .
【答案】
【詳解】根據表格可知,
,,
代入,可得.
故答案為:
題型04根據回歸直線方程估計數據
【典例1】(2024上·黑龍江齊齊哈爾·高三校聯考期末)已知在特定的時期內某人在一個月內每天投入的體育鍛煉時間(分鐘)與一個月內減輕的體重(斤)的一組數據如表所示:
30 40 50 60 70
一個月內減輕的體重與每天投入的體育鍛煉時間之間具有較強的線性相關關系,其線性回歸直線方程是,據此模型估計當此人在一個月內每天投入的體育鍛煉時間為90分鐘時,該月內減輕的體重約為( )
A.斤 B.斤 C.斤 D.斤
【答案】A
【詳解】由表中數據可得


將代入得,解得,
即,
則當時,.
故選:A.
【典例2】(2024下·全國·高二隨堂練習)某科學興趣小組的同學認為生物都是由蛋白質構成的,高溫可以使蛋白質變性失活,于是想初步探究某微生物的成活率與溫度的關系,微生物數量(個)與溫度的部分數據如下表:
溫度 4 8 10 18
微生物數量(個) 30 22 18 14
由表中數據算得回歸方程為,預測當溫度為時,微生物數量為 個.
【答案】9
【詳解】由表格數據可知,,,
因為點在直線上,所以,
即,故當時,,
即預測當溫度為時,微生物數量為9個.
故答案為:9
【變式1】(2024上·全國·高三專題練習)如果在一次實驗中,測得的五組數值如下表所示,經計算知,y對x的線性回歸方程是,預測當時,( )
x 0 1 2 3 4
y 10 15 20 30 35
A.73.5 B.74 C.74.5 D.75
【答案】B
【詳解】由題意可得:,
即樣本中心點為,則,解得,
所以,
令時,,
預測當時,.
故選:B
【變式2】(2024上·全國·高三專題練習)牛膝是莧科多年生藥用草本植物,具有活血通經、補肝腎、強筋骨等功效,可用于治療腰膝酸痛等癥狀.某農戶種植牛膝的時間(單位:天)和牛膝的根部直徑(單位:)的統計表如下:
20 30 40 50 60
0.8 1.3 2.2 3.3 4.5
由上表可得經驗回歸方程為,若此農戶準備在時采收牛膝,據此模型預測,此批牛滕采收時間預計是第 天.
【答案】110
【詳解】,,
又過點,所以,即,
當時,,所以此批牛膝采收時間預計是第110天.
故答案為:110
題型05殘差計算
【典例1】(2024·全國·高三專題練習)已知一組樣本數據,,,,根據這組數據的散點圖分析與之間的線性相關關系,若求得其線性回歸方程為,則在樣本點處的殘差為( )
A.38.1 B.22.6 C. D.91.1
【答案】C
【詳解】因為觀測值減去預測值稱為殘差,
所以當時,,
所以殘差為.
故選:C.
【典例2】(2024·云南楚雄·云南省楚雄彝族自治州民族中學校考一模)對具有線性相關關系的變量有一組觀測數據(),其經驗回歸方程為,且,,則相應于點的殘差為 .
【答案】/
【詳解】經驗回歸直線過樣本點的中心,,,
經驗回歸方程為.當時,,殘差為.
故答案為:.
【典例3】(2023·全國·高二專題練習)隨機選取變量和變量的對觀測數據,選取的第對觀測數據記為,其數值對應如下表所示:
編號
計算得:,,,,.
(1)求變量和變量的樣本相關系數(小數點后保留位),判斷這兩個變量是正相關還是負相關,并推斷它們的線性相關程度;
(2)假設變量關于的一元線性回歸模型為.
(ⅰ)求關于的經驗回歸方程,并預測當時的值;
(ⅱ)設為時該回歸模型的殘差,求、、、、的方差.
參考公式:,,.
【答案】(1)答案見解析
(2)①答案見解析;②
【詳解】(1)解:,
所以,這兩個變量負相關,且具有較強的線性相關性.
(2)解:①,則,
所以,關于的經驗回歸方程為,
當時,則,
所以,當時,的預測值為;
②由,計算得該回歸模型的殘差如下表所示:
所以,殘差的方差為.
【變式1】(2024·全國·高三專題練習)根據一組樣本數據,,,的散點圖分析x與y之間是否存在線性相關關系,求得其線性回歸方程為,則在樣本點處的殘差為( )
A. B. C. D.
【答案】B
【詳解】把代入,得,
所以在樣本點處的殘差.
故選:B.
【變式2】(2024·全國·高三專題練習)從某大學中隨機選取8名女大學生,其身高x(單位:cm)與體重y(單位:kg)數據如下表:
x 165 165 157 170 175 165 155 170
y 48 57 50 54 64 61 43 59
若已知y與x的線性回歸方程為,設殘差記為觀測值與預測值之間的差(即殘差)那么選取的女大學生身高為175cm時,相應的殘差為 .
【答案】4
【詳解】已知y與x的線性同歸方程為
當時:,相應的殘差為:
故答案為:4
【變式3】(2023·高二課時練習)高中女學生的身高預報體重的回歸方程是(其中,的單位分別是cm,kg),則此方程在樣本點處的殘差是 .
【答案】1.5
【詳解】由樣本數據得到,女大學生的身高預報體重的回歸方程是,
當時,,
此方程在樣本處殘差為:.
故答案為:1.5.
題型06相關指數計算
【典例1】(2024上·全國·高三期末)2021年6月17日9時22分,我國酒泉衛星發射中心用長征2F遙十二運載火箭,成功將神舟十二號載人飛船送入預定軌道,順利將聶海勝 劉伯明 湯洪波3名航天員送入太空,發射取得圓滿成功,這標志著中國人首次進入自己的空間站.某公司負責生產的A型材料是神舟十二號的重要零件,該材料應用前景十分廣泛.該公司為了將A型材料更好地投入商用,擬對A型材料進行應用改造.根據市場調研與模擬,得到應用改造投入x(億元)與產品的直接收益y(億元)的數據統計如下表:建立了y與x的兩個回歸模型:模型①:,
模型②:;
序號 1 2 3 4 5 6 7
x 2 3 4 6 8 10 13
y 15 22 27 40 48 54 60
(1)根據表格中的數據,比較模型①,②的相關指數的大小;
(2)據(2)選擇擬合精度更高 更可靠的模型,預測對A型材料進行應用改造的投入為17億元時的直接收益.
附:刻畫回歸效果的相關指數,且當越大時,回歸方程的擬合效果越好..
回歸模型 模型① 模型②
79.31 20.2
【答案】(1)
(2)收益為
【詳解】(1)對于模型①,
對應的,
故對應的,
故對應的相關指數,對于模型②,
同理對應的相關指數,.
(2)故模型②擬合精度更高 更可靠.
故對A型材料進行應用改造的投入為17億元時的直接收益為.
【典例2】(2023·全國·高二專題練習)已知與之間的數據如下表:
(1)求關于的線性回歸方程;(2)完成下面的殘差表:
并判斷(1)中線性回歸方程的回歸效果是否良好(若,則認為回歸效果良好).附:,,,.
【答案】(1);(2)表格見解析,良好.
【詳解】(1)由已知圖表可得,,,,
則,,
故.
(2)∵,∴,,,,,則殘差表如下表所示,
∵ ,
∴,
∴該線性回歸方程的回歸效果良好.
【典例3】(2021下·山東青島·高二統考期中)現代物流成為繼勞動力、自然資源外影響企業生產成本及利潤的重要因素.某企業去年前八個月的物流成本和企業利潤的數據(單位:萬元)如下表所示:
月份
物流成本
利潤
殘差
根據最小二乘法公式求得線性回歸方程為.
(1)求的值,并利用已知的線性回歸方程求出月份對應的殘差值;
(2)請先求出線性回歸模型的決定系數(精確到);若根據非線性模型求得解釋變量(物流成本)對于響應變量(利潤)決定系數,請說明以上兩種模型哪種模型擬合效果更好?
(3)通過殘差分析,懷疑殘差絕對值最大的那組數據有誤,經再次核實后發現其真正利潤應該為萬元.請重新根據最小二乘法的思想與公式,求出新的線性回歸方程.
附1(修正前的參考數據):
,,,.
附2:.
附3:,.
【答案】(1),;(2);線性回歸模型擬合程度更好;(3).
【詳解】(1)因為,,所以
,解得,
所以月份對應的殘差值;
(2)由已知公式得,

所以線性回歸模型擬合程度更好;
(3)由(1)可知,第八組數據的利潤應為(萬元)
此時,又,,,
所以,所以,
所以重新采集數據后,線性回歸方程為.
【變式1】(2022下·寧夏·高二六盤山高級中學校考階段練習)有一組統計數據和,根據數據建立了如下的兩個模型:①,②.通過殘差分析發現第①個線性模型比第②個線性模型擬合效果好.若分別是相關指數和殘差平方和,則下列結論正確的是 .①>,②<,③<,④>.
【答案】①③
【詳解】解:用相關指數的值判斷模型的擬合效果,越大,說明殘差平方和越小,模型的擬合效果越好,因為第①個線性模型比第②個線性模型擬合效果好,所以,;
故答案為:①③
【變式2】(2023上·重慶·高三重慶八中校考階段練習)混凝土的抗壓強度x較容易測定,而抗剪強度y不易測定,工程中希望建立一種能由x推算y的經驗公式,下表列出了現有的9對數據,分別為,,…,.
x 141 152 168 182 195 204 223 254 277
y 23.1 24.2 27.2 27.8 28.7 31.4 32.5 34.8 36.2
以成對數據的抗壓強度x為橫坐標,抗剪強度y為縱坐標作出散點圖,如圖所示.
(1)從上表中任選2個成對數據,求該樣本量為2的樣本相關系數r.結合r值分析,由簡單隨機抽樣得到的成對樣本數據的樣本相關系數是否一定能確切地反映變量之間的線性相關關系?
(2)根據散點圖,我們選擇兩種不同的函數模型作為回歸曲線,根據一元線性回歸模型及最小二乘法,得到經驗回歸方程分別為:①,②.經驗回歸方程①和②的殘差計算公式分別為,,.
(ⅰ)求;
(ⅱ)經計算得經驗回歸方程①和②的殘差平方和分別為,,經驗回歸方程①的決定系數,求經驗回歸方程②的決定系數.
附:相關系數,決定系數,.
【答案】(1),答案見解析
(2)(ⅰ)0;(ⅱ)0.9847
【詳解】(1)不妨設選擇的成對數據分別為,,則
.又由表格數據得,當時,,則.
因為任意兩個樣本點都在一條直線上,則樣本量為2的樣本相關系數絕對值都是1(在樣本相關系數存在的情況下),顯然據此推斷兩個變量完全線性相關是不合理的.
樣本相關系數可以反映變量之間相關的正負性及線性相關的程度,但由于樣本數據的隨機性,樣本相關系數往往不能確切地反映變量之間的相關關系.一般來說,樣本量越大,根據樣本相關系數推新變量之間相關的正負性及線性相關的程度越可靠,而樣本量越小,則越不可靠.
(2)(ⅰ)(直線經過數據的中心).
(ⅱ)∵,∴,
則,
越大,越接近于1,則模型的擬合效果越好,因此經驗回歸方程②的擬合效果更好,為最優模型.
【變式3】(2023·廣東汕頭·統考二模)車胎凹槽深度是影響汽車剎車的因素,汽車行駛會導致輪胎胎面磨損.某實驗室通過試驗測得行駛里程與某品牌輪胎凹槽深度的數據如下:
行駛里程/萬km 0.00 0.64 1.29 1.93 2.57 3.22 3.86 4.51 5.15
輪胎凹槽深度/mm 10.02 8.37 7.39 6.48 5.82 5.20 4.55 4.16 3.82
以行駛里程為橫坐標、輪胎凹槽深度為縱坐標作散點圖,如圖所示.
(1)根據散點圖,可認為散點集中在直線附近,由此判斷行駛里程與輪胎凹槽深度線性相關,并計算得如下數據,請求出行駛里程與輪胎凹槽深度的相關系數(保留兩位有效數字),并推斷它們線性相關程度的強弱;
2.57 6.20 115.10 29.46
附:相關系數
(2)通過散點圖,也可認為散點集中在曲線附近,考慮使用對數回歸模型,并求得經驗回歸方程及該模型的決定系數.已知(1)中的線性回歸模型為,在同一坐標系作出這兩個模型,據圖直觀回答:哪個模型的擬合效果更好?并用決定系數驗證你的觀察所得.
附:線性回歸模型中,決定系數等于相關系數的平方,即.
【答案】(1),相關性較強
(2)答案見解析
【詳解】(1)由題意,,
∵,∴,
∴行駛里程與輪胎凹楳深度成負相關,且相關性較強.
(2)由圖像可知,車胎凹槽深度與對數回歸預報值殘差、偏離更小,擬合度更高,線性回歸預報值偏美較大.
由題(1)得線性回歸模型的相關系數,
決定系數,
由題意,對數回歸模型的決定系數,
∵,∴對數回歸模型的擬合度更高.
A夯實基礎 B能力提升
A夯實基礎
一、單選題
1.(2024·四川綿陽·統考二模)已知變量x,y之間的線性回歸方程為,且變量x,y之間的一組相關數據如表所示,
x 2 4 6 8
y 5 8.2 13 m
則下列說法正確的是( )
A.
B.變量y與x是負相關關系
C.該回歸直線必過點
D.x增加1個單位,y一定增加2個單位
【答案】C
【分析】根據給定數據及回歸方程求出樣本中心點,再逐項判斷即可得解.
【詳解】依題意,,
由,解得,A錯誤;
回歸方程中,,則變量y與x是正相關關系,B錯誤;
由于樣本中心點為,因此該回歸直線必過點,C正確;
由回歸方程知,x增加1個單位,y大約增加2個單位,D錯誤.
故選:C
2.(2024上·全國·高三專題練習)變量,之間有如下對應數據:
4 4.5 5.5 6
12 11 10
已知變量對呈線性相關關系,且回歸方程為,則的值是( )
A.10 B.9 C.8 D.7
【答案】B
【分析】計算出,代入回歸方程,求出的值.
【詳解】,
則有,解得
故選:B.
3.(2024上·全國·高三期末)某同學在研究變量之間的相關關系時,得到以下數據:并采用最小二乘法得到了線性回歸方程,則( )
4.8 5.8 7 8.3 9.1
2.8 4.1 7.2 9.1 11.8
A. B. C. D.
【答案】D
【分析】畫出散點圖,數形結合得到答案.
【詳解】畫出散點圖如下:

從而可以看出中,.
故選:D
4.(2024·全國·高三專題練習)下列四幅殘差分析圖中,與一元線性回歸模型擬合精度最高的是( )
A. B.
C. D.
【答案】D
【分析】根據殘差的特點,殘差點比較均勻地落在水平的帶狀區域中,說明這樣的模型比較合適,帶狀區域的寬度越窄,說明模型的擬合精度越高.即可得到答案.
【詳解】用殘差圖判斷模型的擬合效果,殘差點比較均勻地落在水平的帶狀區域中,說明這樣的模型比較合適,
帶狀區域的寬度越窄,說明模型的擬合精度越高,顯然D選項的擬合精度最高.
故選:D.
5.(2024下·全國·高二隨堂練習)一組成對數據樣本中心點為,由這組數據擬合的線性回歸方程為,用最小二乘法求回歸方程是為了使( )最小.
A.總偏差平方和 B.殘差平方和
C.回歸平方和 D.豎直距離和
【答案】B
【分析】使用最小二乘法的定義進行求解.
【詳解】最小二乘法求回歸方程,是為了使殘差平方和最小,B正確;其他選項錯誤.
故選:B
6.(2024·全國·高三專題練習)為研究每平方米平均建筑費用與樓層數的關系,某開發商收集了一棟住宅樓在建筑過程中,建筑費用的相關信息,將總樓層數與每平米平均建筑成本(單位:萬元)的數據整理成如圖所示的散點圖:
則下面四個回歸方程類型中最適宜作為每平米平均建筑費用和樓層數的回歸方程類型的是( )
A. B.
C. D.
【答案】C
【分析】通過觀察散點圖并結合選項函數的類型得出結果.
【詳解】觀察散點圖,可知是一個單調遞減的曲線圖,結合選項函數的類型可得回歸方程類型是反比例類型,故C正確.
故選:C.
7.(2024上·山東濱州·高三統考期末)某學校一同學研究溫差(單位:℃)與本校當天新增感冒人數(單位:人)的關系,該同學記錄了5天的數據:
5 6 8 9 12
16 20 25 28 36
由上表中數據求得溫差與新增感冒人數滿足經驗回歸方程,則下列結論不正確的是( )
A.與有正相關關系 B.經驗回歸直線經過點
C. D.時,殘差為0.2
【答案】C
【分析】根據和的變化規律,即可判斷A;計算,即可判斷B;將樣本點中心代入回歸直線方程,即可求,即可判斷C;根據回歸直線方程計算時的,計算,即可判斷D.
【詳解】由表格可知,越大,越大,所以與有正相關關系,故A正確;
,,
樣本點中心為,經驗回歸直線經過點,故B正確;
將樣本點中心代入直線方程,得,所以,故C錯誤;
,當 時,,,故D正確.
故選:C
8.(2024上·全國·高三專題練習)已知一組成對數據中y關于x的一元非線性回歸方程,已知,則( )
A. B.1 C. D.
【答案】B
【分析】根據題意,求得和的平均數,根據樣本中心滿足回歸方程,即可求解.
【詳解】因為y關于x的一元非線性回歸方程,
設,則回歸直線方程,
又因為,可得,即樣本中心為,
將樣本中心代入回歸直線方程,可得,解得,即.
故選:B.
二、多選題
9.(2024·全國·模擬預測)下列有關回歸分析的結論中,正確的有( )
A.若回歸方程為,則變量y與x負相關
B.運用最小二乘法求得的經驗回歸直線一定經過樣本點的中心
C.若決定系數的值越接近于1,表示回歸模型的擬合效果越好
D.若散點圖中所有點都在直線上,則相關系數
【答案】ABC
【分析】根據統計案例相關知識逐項分析判斷.
【詳解】對于選項A:因為回歸方程為,可知,
所以變量y與x負相關,故A正確;
對于選項B:由線性回歸方程的性質可知:回歸直線一定經過樣本點的中心,故B正確;
對于選項C:決定系數的值越接近于1,表示回歸模型的擬合效果越好,故C正確;
對于選項D:散點圖中所有點都在直線上,則,
且,所以變量y與x正相關,即,可知,故D錯誤.
故選:ABC.
10.(2024上·廣東揭陽·高三統考期末)2023年入冬以來,流感高發,某醫院統計了一周中連續5天的流感就診人數y與第天的數據如表所示.
x 1 2 3 4 5
y 21 10a 15a 90 109
根據表中數據可知x,y具有較強的線性相關關系,其經驗回歸方程為,則( )
A.樣本相關系數在內 B.當時,殘差為-2
C.點一定在經驗回歸直線上 D.第6天到該醫院就診人數的預測值為130
【答案】AD
【分析】x,y具有較強的正相關關系,可判斷相關系數的范圍,判斷A;計算x,y的平均值,代入回歸直線方程求出a的值,即可求出時的預測值,求得殘差,判斷B;看是否適合回歸直線方程,判斷C;將代入回歸直線方程,求出預測值,判斷D.
【詳解】由題意可知x,y具有較強的正相關關系,故樣本相關系數在內,A正確;
根據題意得,
故,解得,
故當時,,殘差為,B錯誤;
點即點,當時,,
即點不在經驗回歸直線上,C錯誤;
當時,,即第6天到該醫院就診人數的預測值為130,D正確,
故選:AD
三、填空題
11.(2024上·廣東深圳·高三統考期末)某同學收集了變量,的相關數據如下:
x 0.5 2 3 3.5 4 5
y 15
為了研究,的相關關系,他由最小二乘法求得關于的線性回歸方程為,經驗證回歸直線正好經過樣本點,則 .
【答案】69
【分析】結合線性回歸方程必過樣本中心點求解.
【詳解】因為線性回歸方程經過樣本點,所以.
因為:,所以.
所以:.
故答案為:69
12.(2023·高二單元測試)下列關于回歸分析的說法正確的是 (填上所有正確說法的序號)
①相關系數越小,兩個變量的相關程度越弱;
②殘差平方和越大的模型,擬合效果越好;
③用相關指數來刻畫回歸效果時,越小,說明模型的擬合效果越好;
④用最小二乘法求回歸直線方程,是尋求使取最小值時的、的值;
⑤在殘差圖中,殘差點比較均勻地落在水平的帶狀區域內,說明選用的模型比較合適,這樣的帶狀區域的寬度越窄,模型擬合精度越高.
【答案】④⑤
【分析】利用相關系數與兩個變量的相關程度的關系可判斷①;利用殘差的定義可判斷②;利用相關指數與模型的擬合效果之間的關系可判斷③;利用最小二乘法的概念可判斷④;利用殘差圖可判斷⑤.
【詳解】對于①,對于相關系數,越接近于,兩個變量的相關程度越弱,①錯;
對于②,殘差平方和越小的模型,擬合效果越好,②錯;
對于③,用相關指數來刻畫回歸效果時,越大,說明模型的擬合效果越好,③錯;
對于④,用最小二乘法求回歸直線方程,是尋求使取最小值時的、的值,④對;
對于⑤,在殘差圖中,殘差點比較均勻地落在水平的帶狀區域內,說明選用的模型比較合適,這樣的帶狀區域的寬度越窄,模型擬合精度越高,⑤對.
故答案為:④⑤.
四、解答題
13.(2023上·遼寧沈陽·高二校考期末)某班社會實踐小組在寒假去書店體驗圖書銷售員工作,并對某圖書定價x(元)與當天銷量y(本/天)之間的關系進行調查,得到了一組數據,發現變量大致呈線性關系,數據如下表所示
定價x(元) 6 8 10 12
銷量y(本/天) 14 11 8 7
參考數據:,
參考公式:回歸方程中斜率的最小二乘估計值公式為
(1)根據以上數據,求出y關于x的回歸直線方程;
(2)根據回歸直線方程,預測當該圖書每天的銷量為4本時,該圖書的定價是多少元?
【答案】(1);
(2).
【分析】(1)利用最小二乘法直接計算求回歸直線方程即可;
(2)利用回歸直線方程代入計算即可.
【詳解】(1)由表格可知,
則,
所以,
則,故;
(2)由(1)知,當時,,
即當該圖書每天的銷量為4本時,該圖書的定價是元.
14.(2023上·黑龍江雞西·高三雞西市第一中學校校考期末)直播帶貨是一種直播和電商相結合的銷售手段,目前已被廣大消費者所接受.針對這種現狀,某公司決定逐月加大直播帶貨的投入,直播帶貨金額穩步提升,以下是該公司2023年前5個月的帶貨金額:
月份 1 2 3 4 5
帶貨金額萬元 350 440 580 700 880
(1)計算變量的相關系數(結果精確到0.01).
(2)求變量之間的線性回歸方程,并據此預測2023年6月份該公司的直播帶貨金額.
參考數據:,
參考公式:相關系數,線性回歸方程的斜率,截距.
【答案】(1)0.99
(2),986萬元.
【分析】(1)直接代入相關系數方程即可.
(2)求出線性回歸方程,再代入即可.
【詳解】(1)
(2)因為,
所以,
所以變量之間的線性回歸方程為,
當時,(萬元).
所以預測2023年6月份該公司的直播帶貨金額為986萬元.
B能力提升
15.(2023上·河南焦作·高二博愛縣第一中學校考期中)已知高三某學生為了迎接高考,參加了學校的5次模擬考試,其中5次的模擬考試成績如表所示,
次數(x) 1 2 3 4 5
考試成績(y) 498 499 497 501 505
設變量x,y滿足回歸直線方程.
(1)假如高考也符合上述的模擬考試的回歸直線方程,高考看作第10次模擬考試,預測2024年的高考的成績;
(2)從上面的5次考試成績中隨機抽取3次,其中2次成績都大于500分的概率.
參考公式:回歸直線方程中的斜率和截距的最小二乘估計公式分別為,.
【答案】(1)預測2024年的高考成績為511.2分;
(2).
【分析】(1)依題意求出,,即可求出、,從而得到回歸直線方程,再將代入計算可得;
(2)利用列舉法列出所有可能結果,再根據古典概型的概率公式計算可得.
【詳解】(1)由表得,,
∴.
將點代入回歸直線方程可得,解得,
∴回歸直線方程為.
當時,,
∴預測2024年的高考成績為511.2分.
(2)記“從5次考試成績中選出3次成績”為事件,
則事件的情況有,,,,
,,,,
,,共10種情況,
其中2次成績都大于500分情況有,,,共3種情況,
∴所求的概率.
16.(2023·全國·模擬預測)2015—2019年,中國社會消費品零售額占GDP的比重超過4種,2020年后,中國社會消費品零售額占GDP的比重逐年下降.下表為2018—2022年中國社會消費品零售額(單位:萬億元)及其占GDP的比重y(單位:%)的數據,其中2018—2022年對應的年份代碼x依次為1~5.
年份代碼x 1 2 3 4 5
社會消費品零售額 37.8 40.8 39.2 44.1 44.0
社會消費品零售額占 GDP的比重y/% 41.3 41.5 39.0 38.6 36.7
(1)由上表數據,是否可用一元線性回歸模型擬合y與x的關系,請用相關系數加以說明.
(2)請建立y關于x的一元線性回歸方程.
(3)從2018—2022年中國社會消費品零售額這5個數據中隨機抽取2個數據.若抽取的2個數據中至少有1個數據大于40.0,求這2個數據恰好有1個數據不小于44.0的概率.
附:,,,,
相關系數.
對于一組數據,其一元線性回歸直線的斜率和截距的最小二乘估計公式分別為,.
【答案】(1)可以用一元線性回歸模型擬合y與x的關系;說明見解析;
(2);
(3).
【分析】(1)先運用相關系數公式進行計算,再根據結果說明即可;
(2)代入公式先計算,再利用樣本中心點坐標滿足一元線性回歸方程計算即得;
(3)利用條件概率公式計算概率即可.
【詳解】(1)由題意,知,.
因為,,,所以

所以.
所以y與x的線性相關程度高,可以用一元線性回歸模型擬合y與x的關系.
(2)因為,,,,
所以.
把點的坐標代入,得,
所以y關于x的一元線性回歸方程為.
(3)記“抽取的2個數據中至少有1個數據大于40.0”為事件A,
“這2個數據恰好有1個數據不小于44.0”為事件B,則“抽取的2個數據中
至少有1個數據大于40.0時,恰好有1個數據不小于44.0” 為事件,
所以.
17.(2023上·云南昆明·高三校考階段練習)云南省統計局發布《全省旅游業發展情況(2015-2022年)》報告,其中2015年至2022年游客總人數y(單位:億人次)的數據如下表:
年份 2015 2016 2017 2018 2019 2020 2021 2022
年份代號x 1 2 3 4 5 6 7 8
游客總人數y 3.3 4.3 5.7 6.9 8.1 5.3 6.5 8.4
為了預測2023年云南省游客總人數,根據2015年至2022年游客總人數y的數據建立線性回歸模型一,得到回歸方程:,但由于受到2020年疫情影響,估計預測不準確,若用2015年至2019年數據建立線性回歸模型二,得到回歸方程:
(1)根據和預測2023年云南省游客總人數(預測數據精確到0.1);
(2)為了檢驗兩種模型的預測效果,對兩種模型作殘差分析得到:
模型一:總偏差平方和,殘差平方和;
模型二:總偏差平方和,殘差平方和,
用來比較模型一與模型二的擬合效果(精確到0.001);
(3)根據2020年至2022年游客總人數y的數據建立線性回歸模型三,求回歸方程,并根據預測2023年云南省游客總人數(預測數據精確到0.1).
參考公式:,,,.
【答案】(1)億人次,億人次
(2)模型二的擬合效果更好
(3),10(億人次)
【分析】(1)代入回歸方程求解,
(2)由參考公式計算后判斷,
(3)由參考公式求解回歸方程.
【詳解】(1)根據預測2023年云南省游客總人數為(億人次);
根據預測2023年云南省游客總人數為(億人次).
(2)模型一:;
模型二:.
因為,所以模型二的擬合效果更好.
(3)設2020年至2022年的年份代號x分別為1,2,3,
則,,,
,所以,,
所以:,所以當時,.
所以根據預測2023年云南省游客總人數為10(億人次).
21世紀教育網(www.21cnjy.com)

展開更多......

收起↑

資源預覽

<pre id="tfb94"><li id="tfb94"></li></pre>

<bdo id="tfb94"><rt id="tfb94"></rt></bdo>
  • <menu id="tfb94"><dl id="tfb94"></dl></menu><i id="tfb94"><acronym id="tfb94"><sub id="tfb94"></sub></acronym></i>

    1. 主站蜘蛛池模板: 虎林市| 金堂县| 黄平县| 丰都县| 望奎县| 大新县| 攀枝花市| 吐鲁番市| 错那县| 云梦县| 辽宁省| 和田县| 连云港市| 八宿县| 黄骅市| 永丰县| 东城区| 龙井市| 磴口县| 乌拉特前旗| 西乌| 蒲城县| 香港 | 壤塘县| 涞源县| 修文县| 瑞安市| 华宁县| 平利县| 宜良县| 云林县| 泰来县| 黄石市| 巩义市| 天门市| 阿城市| 连平县| 额济纳旗| 贵溪市| 青铜峡市| 嵊州市|