中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

2025年新高考數(shù)學(xué)一輪復(fù)習(xí)第9章拔高點(diǎn)突破01統(tǒng)計(jì)背景下的新定義問(wèn)題(四大題型)(學(xué)生版+解析)

資源下載
  1. 二一教育資源

2025年新高考數(shù)學(xué)一輪復(fù)習(xí)第9章拔高點(diǎn)突破01統(tǒng)計(jì)背景下的新定義問(wèn)題(四大題型)(學(xué)生版+解析)

資源簡(jiǎn)介

拔高點(diǎn)突破01 統(tǒng)計(jì)背景下的新定義問(wèn)題
目錄
01 方法技巧與總結(jié) 2
02 題型歸納與總結(jié) 3
題型一:新定義統(tǒng)計(jì)量或指標(biāo) 3
題型二:新定義的統(tǒng)計(jì)方法或技術(shù) 7
題型三:新定義的數(shù)據(jù)可視化方法 10
題型四:綜合應(yīng)用題 15
03 過(guò)關(guān)測(cè)試 22
針對(duì)高中數(shù)學(xué)統(tǒng)計(jì)背景下的新定義問(wèn)題,解題方法的總結(jié)可以從以下幾個(gè)方面進(jìn)行:
一、理解新定義的本質(zhì)
首先,需要明確題目中的新定義是針對(duì)統(tǒng)計(jì)中的某一概念、方法或運(yùn)算的拓展或創(chuàng)新。理解這一新定義的本質(zhì)屬性、條件、結(jié)論以及適用范圍是解題的第一步。這要求學(xué)生具備較強(qiáng)的閱讀理解能力和抽象思維能力,能夠快速準(zhǔn)確地把握新定義的核心內(nèi)容。
二、聯(lián)系已學(xué)知識(shí)
新定義問(wèn)題往往不是孤立存在的,它們往往與已學(xué)的統(tǒng)計(jì)知識(shí)有著緊密的聯(lián)系。因此,在理解新定義的基礎(chǔ)上,學(xué)生需要將其與已學(xué)的統(tǒng)計(jì)概念、方法或運(yùn)算進(jìn)行聯(lián)系,找到它們之間的共同點(diǎn)和不同點(diǎn)。這樣不僅可以幫助學(xué)生更好地理解新定義,還可以為后續(xù)的解題提供思路和方法。
三、構(gòu)建解題模型
對(duì)于統(tǒng)計(jì)背景下的新定義問(wèn)題,構(gòu)建解題模型是解決問(wèn)題的關(guān)鍵。學(xué)生需要根據(jù)題目的具體要求和已學(xué)知識(shí),構(gòu)建出適合解決該問(wèn)題的統(tǒng)計(jì)模型。這個(gè)模型可以是基于某種統(tǒng)計(jì)分布的假設(shè)檢驗(yàn)?zāi)P停部梢允腔跀?shù)據(jù)特征的描述統(tǒng)計(jì)模型。在構(gòu)建模型的過(guò)程中,學(xué)生需要充分考慮新定義的條件和結(jié)論,確保模型的準(zhǔn)確性和有效性。
四、運(yùn)用統(tǒng)計(jì)方法進(jìn)行計(jì)算和分析
在構(gòu)建好解題模型之后,學(xué)生需要運(yùn)用統(tǒng)計(jì)方法進(jìn)行計(jì)算和分析。這包括數(shù)據(jù)的收集、整理、描述、推斷等各個(gè)方面。在計(jì)算和分析的過(guò)程中,學(xué)生需要嚴(yán)格按照統(tǒng)計(jì)方法的步驟和要求進(jìn)行操作,確保結(jié)果的準(zhǔn)確性和可靠性。同時(shí),學(xué)生還需要注意對(duì)新定義條件的應(yīng)用和理解,確保計(jì)算和分析過(guò)程符合題目要求。
五、總結(jié)歸納
最后,學(xué)生需要對(duì)解題過(guò)程進(jìn)行總結(jié)歸納。這包括對(duì)新定義的理解和應(yīng)用情況的反思、對(duì)解題思路和方法的總結(jié)以及對(duì)統(tǒng)計(jì)知識(shí)的鞏固和拓展等方面。通過(guò)總結(jié)歸納,學(xué)生可以更好地掌握新定義問(wèn)題的解題方法,提高自己的統(tǒng)計(jì)素養(yǎng)和解題能力。
具體解題步驟建議
仔細(xì)閱讀題目:理解題目中的新定義及其條件、結(jié)論等要素。
聯(lián)系已學(xué)知識(shí):將新定義與已學(xué)的統(tǒng)計(jì)知識(shí)進(jìn)行聯(lián)系和對(duì)比,找到它們之間的共同點(diǎn)和不同點(diǎn)。
構(gòu)建解題模型:根據(jù)題目要求和已學(xué)知識(shí)構(gòu)建解題模型,明確模型的假設(shè)條件、計(jì)算步驟和分析方法。
進(jìn)行計(jì)算和分析:按照統(tǒng)計(jì)方法的步驟和要求進(jìn)行計(jì)算和分析,確保結(jié)果的準(zhǔn)確性和可靠性。
總結(jié)歸納:對(duì)解題過(guò)程進(jìn)行總結(jié)歸納,反思解題過(guò)程中的得失和體會(huì),鞏固和拓展自己的統(tǒng)計(jì)知識(shí)。
題型一:新定義統(tǒng)計(jì)量或指標(biāo)
【典例1-1】設(shè),,…,是總體數(shù)據(jù)中抽取的樣本,k為正整數(shù),則稱(chēng)為樣本k階中心矩,其中為樣本均值.統(tǒng)計(jì)學(xué)中,當(dāng)我們遇到數(shù)據(jù)分布形狀不對(duì)稱(chēng)時(shí),常用樣本中心矩的函數(shù)——樣本偏度來(lái)刻畫(huà)偏離方向與程度.若將樣本數(shù)據(jù),,…,繪制柱形圖如圖所示,則( )
2
A. B.
C. D.與0的大小關(guān)系不能確定
【答案】C
【解析】,
樣本偏度反應(yīng)數(shù)據(jù)偏離方向與程度,由圖表可得,
有比較多的小于樣本均值的數(shù)據(jù),
當(dāng)右側(cè)有長(zhǎng)尾時(shí),受極端值影響,,
而樣本方差,則.
故選:C.
【典例1-2】定義空間直角坐標(biāo)系中的任意點(diǎn)的“數(shù)”為:在點(diǎn)的坐標(biāo)中不同數(shù)字的個(gè)數(shù),如:,點(diǎn)的坐標(biāo),則所有這些點(diǎn)的“數(shù)”的均值與最小值之差為 .
【答案】
【解析】由點(diǎn)的坐標(biāo),可分三種情況討論:
①恰有3個(gè)相同數(shù)字的排列為種,則共有4個(gè);
②恰有2個(gè)相同數(shù)字的排列為種,則共有36個(gè);
③3個(gè)數(shù)字各不相同的排列為種,則共有24個(gè),
所以點(diǎn)的“數(shù)”的平均值為,
則平均值與最小值之差為.
故答案為:.
【變式1-1】(2024·河北·模擬預(yù)測(cè))機(jī)器模型預(yù)測(cè)常常用于只有正確與錯(cuò)誤兩種結(jié)果的問(wèn)題.表1為根據(jù)模型預(yù)測(cè)結(jié)果與真實(shí)情況的差距的情形表格,定義真正例率,假正例率.概率閾值為自行設(shè)定的用于判別正(反)例的值,若分類(lèi)器(分類(lèi)模型)對(duì)該樣例的預(yù)測(cè)正例概率大于等于設(shè)定的概率閾值,則記分類(lèi)器預(yù)測(cè)為正例,反之預(yù)測(cè)為反例.
總例 預(yù)測(cè)結(jié)果
正例 反例
真實(shí) 情況 正例 真正例 假反例
反例 假正例 真反例
表1分類(lèi)結(jié)果樣例劃分
利用這些指標(biāo)繪制出的ROC曲線可衡量模型的評(píng)價(jià)效果:將各樣例的預(yù)測(cè)正例概率與從大到小排序并依次作為概率閾值,分別計(jì)算相應(yīng)概率閾值下的與.以為橫坐標(biāo),為縱坐標(biāo),得到標(biāo)記點(diǎn).依次連接各標(biāo)記點(diǎn)得到的折線就是ROC曲線.圖1為甲分類(lèi)器對(duì)于8個(gè)樣例的ROC曲線,表2為甲,乙分類(lèi)器對(duì)于相同8個(gè)樣例的預(yù)測(cè)數(shù)據(jù).
樣例數(shù)據(jù) 甲分 類(lèi)器 乙分 類(lèi)器
樣例 標(biāo)號(hào) 樣例 屬性 預(yù)測(cè)正 例概率 預(yù)測(cè)正 例概率
1 正例 0.23 0.34
2 正例 0.58 0.53
3 反例 0.15 0.13
4 反例 0.62 0.39
5 正例 0.47 0.87
6 反例 0.47 0.53
7 反例 0.33 0.11
8 正例 0.77 0.63
表2甲,乙分類(lèi)器對(duì)于相同8個(gè)樣例的預(yù)測(cè)數(shù)據(jù)

(1)當(dāng)概率閾值為0.47時(shí),求甲分類(lèi)器的ROC曲線中的對(duì)應(yīng)點(diǎn);
(2)在圖2中繪制乙分類(lèi)器對(duì)應(yīng)的ROC曲線(無(wú)需說(shuō)明繪圖過(guò)程),并直接寫(xiě)出甲,乙兩分類(lèi)器的ROC曲線與軸,直線所圍封閉圖形的面積;
(3)按照上述思路,比較甲,乙兩分類(lèi)器的預(yù)測(cè)效果,并直接寫(xiě)出理想分類(lèi)器的ROC曲線與軸,直線所圍封閉圖形的面積為1的充要條件.
【解析】(1)概率閾值為0.47時(shí),
真正例為,假反例為,假正例為,真反例為,
則.
所以橫坐標(biāo),縱坐標(biāo),
故當(dāng)概率閾值為0.47時(shí),求甲分類(lèi)器的ROC曲線中的對(duì)應(yīng)點(diǎn)對(duì)應(yīng)點(diǎn)為.
(2)乙分類(lèi)器對(duì)應(yīng)的ROC曲線如下圖所示.
由已知題意可得,甲、乙分類(lèi)器的ROC曲線都經(jīng)過(guò),
作如下圖所示的輔助線,每個(gè)小直角三角形的面積都等于,
大直角三角形的面積都等于,故所求面積為.
所以,甲分類(lèi)器的ROC曲線與軸,直線所圍封閉圖形的面積為.
作如下圖所示的輔助線,同理可得所求面積為.
所以,乙分類(lèi)器的ROC曲線與軸,直線所圍封閉圖形的面積為.
(3)乙分類(lèi)器的預(yù)測(cè)效果更好.
由(2)分析可知,
乙分類(lèi)器的ROC曲線與軸,直線所圍封閉圖形的面積較甲的大些,
故可認(rèn)為乙分類(lèi)器的預(yù)測(cè)效果更好.
充要條件:所有真實(shí)屬性為正例的樣例的預(yù)測(cè)正例概率的最小值大于所有真實(shí)屬性為反例的樣例的預(yù)測(cè)正例概率的最大值.
題型二:新定義的統(tǒng)計(jì)方法或技術(shù)
【典例2-1】(2024·河北衡水·一模)為檢測(cè)出新冠肺炎的感染者,醫(yī)學(xué)上可采用“二分檢測(cè)法”,假設(shè)待檢測(cè)的總?cè)藬?shù)是,將個(gè)人的樣本混合在一起做第1輪檢測(cè)(檢測(cè)一次),如果檢測(cè)結(jié)果為陰性,可確定這批人未感染;如果檢測(cè)結(jié)果為陽(yáng)性,可確定其中有感染者,則將這批人平均分為兩組,每組人的樣本混合在一起做第2輪檢測(cè),每組檢測(cè)1次,如此類(lèi)推,每輪檢測(cè)后,排除結(jié)果為陰性的那組人,而將每輪檢測(cè)后結(jié)果為陽(yáng)性的組再平均分成兩組,做下一輪檢測(cè),直到檢測(cè)出所有感染者(感染者必須通過(guò)檢測(cè)來(lái)確定),若待檢測(cè)的總?cè)藬?shù)為8,采用“二分檢測(cè)法”構(gòu)測(cè),經(jīng)過(guò)4輪共7次檢測(cè)后確定了所有感染者,則感染者人數(shù)的所有可能值為 人.若待檢測(cè)的總?cè)藬?shù)為,且假設(shè)其中有2名感染者,采用“二分檢測(cè)法”所需檢測(cè)總次數(shù)記為n,則n的最大值為 .
【答案】 1,2 4m-1
【解析】①若待檢測(cè)的總?cè)藬?shù)為8,則第一輪需檢測(cè)1次;第2輪需檢測(cè)2次,每次檢查的均是4人組;第3輪需檢測(cè)2次,每次檢查的是有感染的4人組均分的兩組;第4輪需檢測(cè)2次;則共需檢測(cè)7次,此時(shí)感染者人數(shù)為1或2人;
②若待檢測(cè)的總?cè)藬?shù)為,且假設(shè)其中有不超過(guò)2名感染者,
若沒(méi)有感染者,則只需1次檢測(cè)即可;
若只有1個(gè)感染者,則只需次檢測(cè);
若只有2個(gè)感染者,若要檢測(cè)次數(shù)最多,則第2輪檢測(cè)時(shí),2個(gè)感染者不位于同一組,
此時(shí)相當(dāng)兩個(gè)待檢測(cè)均為的組,
每組1個(gè)感染者,此時(shí)每組需要次檢測(cè),
所以此時(shí)兩組共需次檢測(cè),
故有2個(gè)感染者,且檢測(cè)次數(shù)最多,共需次檢測(cè),
所以采用“二分檢測(cè)法”所需檢測(cè)總次數(shù)記為n,則n的最大值為.
故答案為:1,2;
【典例2-2】已知數(shù)據(jù)的平均數(shù)為,設(shè)為該組數(shù)據(jù)的“階方差”,若,則與的大小關(guān)系為( )
A. B. C. D.與奇偶性有關(guān)
【答案】A
【解析】因?yàn)椋裕?br/>因?yàn)椋遥?br/>所以當(dāng)為偶數(shù)時(shí),為偶數(shù),所以,
當(dāng)時(shí),;
當(dāng)時(shí),則,所以,
綜上, ,
所以,
當(dāng)為奇數(shù)時(shí),為奇數(shù),所以,
當(dāng)時(shí),;
當(dāng)時(shí),則,所以,
綜上,,
所以,
綜上所述:.
故選:A
【變式2-1】已知樣本的平均數(shù)為,設(shè)為該樣本的“階方差”,則( )
A.
B.對(duì)任意恒成立
C.當(dāng)為奇數(shù)時(shí),不可能為負(fù)數(shù)
D.若,則
【答案】D
【解析】對(duì)于A,因?yàn)椋裕蔄錯(cuò)誤;
對(duì)于B,取,則,故B錯(cuò)誤;
對(duì)于C,由上述過(guò)程可知,C錯(cuò)誤;
對(duì)于D,易知,因?yàn)椋裕裕蔇正確.
故選:D.
【變式2-2】(多選題)(2024·高三·湖北·期中)基于小汽車(chē)的“車(chē)均擁堵指數(shù)”,其取值范圍是,值越大表明擁堵程度越強(qiáng)烈.在這個(gè)公式中,為路段上統(tǒng)計(jì)時(shí)間間隔內(nèi)車(chē)輛平均行駛速度,為路段上自由流狀態(tài)下車(chē)輛行駛速度,且結(jié)合地圖匹配算法可得到,其中表示浮動(dòng)車(chē)的速度.下列說(shuō)法正確的是( )
A.的值越大,的值越小
B.若,則去掉后得到的的值變小
C.若,則去掉后得到的的值不變
D.若,則樣本的方差小于樣本的方差
【答案】BC
【解析】的值與的大小沒(méi)有必然聯(lián)系,無(wú)法確定值的變化,故A錯(cuò)誤;
若,則去掉后的值變大,因此的值變小,故B正確;
若當(dāng),則去掉后,的值不變,得到的的值不變,故C正確;
若,無(wú)法判斷樣本的方差與樣本的方差之間的大小關(guān)系,故D錯(cuò)誤.
故選:BC.
【變式2-3】(多選題)(2024·河北邯鄲·三模)為了估計(jì)一批產(chǎn)品的不合格品率,現(xiàn)從這批產(chǎn)品中隨機(jī)抽取一個(gè)樣本容量為的樣本,定義,于是,,,記(其中或1,),稱(chēng)表示為參數(shù)的似然函數(shù).極大似然估計(jì)法是建立在極大似然原理基礎(chǔ)上的一個(gè)統(tǒng)計(jì)方法,極大似然原理的直觀想法是:一個(gè)隨機(jī)試驗(yàn)如有若干個(gè)可能的結(jié)果A,B,C,…,若在一次試驗(yàn)中,結(jié)果A出現(xiàn),則一般認(rèn)為試驗(yàn)條件對(duì)A出現(xiàn)有利,也即A出現(xiàn)的概率很大. 極大似然估計(jì)是一種用給定觀察數(shù)據(jù)來(lái)評(píng)估模型參數(shù)的統(tǒng)計(jì)方法,即“模型已定,參數(shù)未知”,通過(guò)若干次試驗(yàn),觀察其結(jié)果,利用試驗(yàn)結(jié)果得到某個(gè)參數(shù)值能夠使樣本出現(xiàn)的概率為最大.根據(jù)以上原理,下面說(shuō)法正確的是( )
A.有外形完全相同的兩個(gè)箱子,甲箱有99個(gè)白球1個(gè)黑球,乙箱有1個(gè)白球99個(gè)黑球.今隨機(jī)地抽取一箱,再?gòu)娜〕龅囊幌渲谐槿∫磺颍Y(jié)果取得白球,那么該球一定是從甲箱子中抽出的
B.一個(gè)池塘里面有鯉魚(yú)和草魚(yú),打撈了100條魚(yú),其中鯉魚(yú)80條,草魚(yú)20條,那么推測(cè)鯉魚(yú)和草魚(yú)的比例為4:1時(shí),出現(xiàn)80條鯉魚(yú)、20條草魚(yú)的概率是最大的
C.
D.達(dá)到極大值時(shí),參數(shù)的極大似然估計(jì)值為
【答案】BCD
【解析】極大似然是一種估計(jì)方法,A錯(cuò)誤;
設(shè)鯉魚(yú)和草魚(yú)的比例為,則出現(xiàn)80條鯉魚(yú),20條草魚(yú)的概率為,
設(shè)

時(shí),,時(shí),,
在上單調(diào)遞增,在上單調(diào)遞減,
故當(dāng)時(shí),最大,故B正確;
根據(jù)題意,(其中或1,),
所以,可知C正確;
令,解得,且時(shí),時(shí),故在上遞增,在上遞減,故達(dá)到極大值時(shí),參數(shù)的極大似然估計(jì)值為,故D正確.
故選:BCD
題型三:新定義的數(shù)據(jù)可視化方法
【典例3-1】 2021年,小李老師的親戚準(zhǔn)備購(gòu)買(mǎi)一輛新的卡車(chē)用來(lái)跑運(yùn)輸,可選的車(chē)型主要有種.分別為,,,,現(xiàn)在有個(gè)指標(biāo):維修期限,百升汽油里數(shù),最大載重噸數(shù),價(jià)格,可能性,靈敏性來(lái)衡量,其中可靠性和靈敏性為評(píng)分,如下表.為了統(tǒng)一標(biāo)準(zhǔn)用來(lái)分析比較,小李老師將數(shù)據(jù)做了以下處理:.(表示第行第列的原始數(shù)據(jù),表示第行第列的原始數(shù)據(jù)處理后的數(shù)據(jù),表示第列的原始數(shù)據(jù))
如果用綜合指標(biāo)來(lái)做標(biāo)準(zhǔn),則的綜合指標(biāo)為( )
A. B. C. D.
【答案】D
【解析】根據(jù)題意可得,的各項(xiàng)指標(biāo)分別為,,,,,
所以的綜合指標(biāo).
故選:.
【典例3-2】(2024·四川涼山·二模)高三模擬考試常常劃定的總分各批次分?jǐn)?shù)線,通過(guò)一定的數(shù)學(xué)模型,確定不同學(xué)科在一本、二本等各批次“學(xué)科上線有雙分”的分?jǐn)?shù)線.考生總成績(jī)達(dá)到總分各批次分?jǐn)?shù)線的稱(chēng)為總分上線;考生某一單科成績(jī)達(dá)到及學(xué)科上線有雙分的稱(chēng)為單科上線.學(xué)科對(duì)總分的貢獻(xiàn)或匹配程度評(píng)價(jià)有很大的意義.利用“學(xué)科對(duì)總分上線貢獻(xiàn)率”和“學(xué)科有效分上線命中率”這兩項(xiàng)評(píng)價(jià)指標(biāo),來(lái)反映各學(xué)科的單科成績(jī)對(duì)考生總分上線的貢獻(xiàn)與匹配程度,這對(duì)有效安排備考復(fù)習(xí)計(jì)劃具有十分重要的意義.某州一診考試劃定總分一本線為465分,數(shù)學(xué)一本線為104分,某班一小組的總分和數(shù)學(xué)成績(jī)?nèi)绫恚瑒t該小組“數(shù)學(xué)學(xué)科對(duì)總分上線貢獻(xiàn)率、有效分上線命中率”分別是( )(結(jié)果保留到小數(shù)點(diǎn)后一位有效數(shù)字)
學(xué)生編號(hào) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
數(shù)學(xué)成績(jī) 120 117 122 101 100 112 99 111 102 100 89 98 92 84 94 113 97 104 85 85
總分成績(jī) 495 494 493 485 483 483 482 480 479 475 471 470 463 457 454 453 448 448 441 440
A.41.7%,71.4% B.60%,71.4%
C.41.7%,35% D.60%,35%
【答案】A
【解析】由圖表知雙過(guò)線人數(shù)為5人,單過(guò)線人數(shù)為7人,總分過(guò)線人數(shù)為12人;
“學(xué)科對(duì)總分上線貢獻(xiàn)率”為,
“學(xué)科有效分上線命中率”為,
故選:A.
【變式3-1】某省新高考中選考科目采用賦分制,具體轉(zhuǎn)換規(guī)則和步驟如下:第一步,按照考生原始分從高到低按成績(jī)比例劃定、、、、共五個(gè)等級(jí)(見(jiàn)下表).第二步,將至五個(gè)等級(jí)內(nèi)的考生原始分,依照等比例轉(zhuǎn)換法則,分別對(duì)應(yīng)轉(zhuǎn)換到100~86、85~71、70~56、55~41和40~30五個(gè)分?jǐn)?shù)段,從而將考生的等級(jí)轉(zhuǎn)換成了等級(jí)分.
等級(jí)
比例 15% 35% 35% 13% 2%
賦分區(qū)間 100-86 85-71 70-56 55-41 40-30
賦分公式:,計(jì)算出來(lái)的經(jīng)過(guò)四舍五人后即為賦分成績(jī).
某次考試,化學(xué)成績(jī)等級(jí)的原始最高分為98分,最低分為63分.學(xué)生甲化學(xué)原始成績(jī)?yōu)?6分,則該學(xué)生的化學(xué)賦分分?jǐn)?shù)為( )
A.85 B.88 C.91 D.95
【答案】C
【解析】由題意,該學(xué)生的化學(xué)賦分分?jǐn)?shù)為,則,
所以分.
故選:C
【變式3-2】某公司有甲乙兩條生產(chǎn)線生產(chǎn)同一種產(chǎn)品,為了解產(chǎn)品的質(zhì)量情況,對(duì)兩條生產(chǎn)線生產(chǎn)的產(chǎn)品進(jìn)行簡(jiǎn)單隨機(jī)抽樣,經(jīng)檢測(cè)得到了A、B的兩項(xiàng)質(zhì)量指標(biāo)值,記為,定義產(chǎn)品的指標(biāo)偏差,數(shù)據(jù)如下表:
甲生產(chǎn)線抽樣產(chǎn)品編號(hào) 指標(biāo) 1 2 3 4 5 6 7 8 9 10
0.98 0.96 1.07 1.02 0.99 0.93 0.92 0.96 1.11 1.02
2.01 1.97 1.96 2.03 2.04 1.98 1.95 1.99 2.07 2.02
0.03 0.07 0.11 0.05 0.05 0.09 0.13 0.05 0.18 0.04
乙生產(chǎn)線抽樣產(chǎn)品編號(hào) 指標(biāo) 1 2 3 4 5 6 7 8
1.02 0.97 0.95 0.94 1.13 0.98 0.97 1.01
2.01 2.03 2.15 1.93 2.01 2.02 2.19 2.04
0.03 0.06 0.20 0.13 0.14 0.04 0.22 0.05
假設(shè)用頻率估計(jì)概率,且每件產(chǎn)品的質(zhì)量相互獨(dú)立.
(1)從甲生產(chǎn)線上隨機(jī)抽取一件產(chǎn)品,估計(jì)該產(chǎn)品滿(mǎn)足且的概率;
(2)從甲乙兩條生產(chǎn)線上各隨機(jī)抽取一件產(chǎn)品,設(shè)表示這兩件產(chǎn)品中滿(mǎn)足的產(chǎn)品數(shù),求的分布列和數(shù)學(xué)期望;
(3)已知的值越小則該產(chǎn)品質(zhì)量越好.如果甲乙兩條生產(chǎn)線各生產(chǎn)一件產(chǎn)品,根據(jù)現(xiàn)有數(shù)據(jù)判斷哪條生產(chǎn)線上的產(chǎn)品質(zhì)量更好?并說(shuō)明理由.
【解析】(1)記表示“從甲生產(chǎn)線上隨機(jī)抽取一件產(chǎn)品,該產(chǎn)品滿(mǎn)足且”.
用頻率估計(jì)概率,則.
所以該產(chǎn)品滿(mǎn)足且的概率為.
(2)由表格數(shù)據(jù),用頻率估計(jì)概率,
可得“從甲生產(chǎn)線上隨機(jī)抽取一件產(chǎn)品,該產(chǎn)品滿(mǎn)足”的概率為;
“從乙生產(chǎn)線上隨機(jī)抽取一件產(chǎn)品,該產(chǎn)品滿(mǎn)足”的概率為.
由題意,的所有可能取值為.


所以的分布列為
0 1 2
所以的數(shù)學(xué)期望為.
(3)甲生產(chǎn)線上的產(chǎn)品質(zhì)量更好,
因?yàn)榧咨a(chǎn)線上值的平均值,
乙生產(chǎn)線上值的平均值,
所以甲生產(chǎn)線上值的平均值明顯比乙小,
所以甲生產(chǎn)線上的產(chǎn)品質(zhì)量更好.
其它理由:從甲乙兩生產(chǎn)線的樣本中各隨機(jī)取一件,則
甲生產(chǎn)品的值小于乙的概率為,
所以甲生產(chǎn)線上的產(chǎn)品質(zhì)量更好.
【變式3-3】定義:為不超過(guò)的最大整數(shù)部分,如,.甲、乙兩個(gè)學(xué)生高二的6次數(shù)學(xué)測(cè)試成績(jī)(測(cè)試時(shí)間為90分鐘,滿(mǎn)分100分)如下表所示:
高二成績(jī) 第1次考試 第2次考試 第3次考試 第4次考試 第5次考試 第6次考試
甲 68 74 77 84 88 95
乙 71 75 82 84 86 94
進(jìn)入高三后,由于改進(jìn)了學(xué)習(xí)方法,甲、乙這兩個(gè)學(xué)生的數(shù)學(xué)測(cè)試成績(jī)預(yù)計(jì)有了大的提升.設(shè)甲或乙高二的數(shù)學(xué)測(cè)試成績(jī)?yōu)椋簦瑒t甲或乙高三的數(shù)學(xué)測(cè)試成績(jī)預(yù)計(jì)為;若,則甲或乙高三的數(shù)學(xué)測(cè)試成績(jī)預(yù)計(jì)為100.
(1)試預(yù)測(cè):在將要進(jìn)行的高三6次數(shù)學(xué)測(cè)試成績(jī)(測(cè)試時(shí)間為90分鐘,滿(mǎn)分100分)中,甲、乙兩個(gè)學(xué)生的成績(jī)(填入下列表格內(nèi));
高三成績(jī) 第1次考試 第2次考試 第3次考試 第4次考試 第5次考試 第6次考試


(2)記高三任意一次數(shù)學(xué)測(cè)試成績(jī)估計(jì)值為,規(guī)定:,記為轉(zhuǎn)換分為3分;,記為轉(zhuǎn)換分為4分;,記為轉(zhuǎn)換分為5分.現(xiàn)從乙的6次數(shù)學(xué)測(cè)試成績(jī)中任意抽取2次,求這2次成績(jī)的轉(zhuǎn)換分之和為8分的概率.
【解析】(1)由已知,預(yù)測(cè)高三6次數(shù)學(xué)測(cè)試成績(jī)?nèi)缦拢?br/>高三成績(jī) 第1次考試 第2次考試 第3次考試 第4次考試 第5次考試 第6次考試
甲 84 90 93 93 97 100
乙 87 91 91 93 95 100
(2)在乙的高三6次數(shù)學(xué)測(cè)試預(yù)測(cè)成績(jī)中,轉(zhuǎn)換分為3分的有1次,記為A;
轉(zhuǎn)換分為4分的有4次,記為;轉(zhuǎn)換分為5分的有1次,記為.
現(xiàn)從中任意抽取2次,一共有15種結(jié)果,它們是:


其中2次成績(jī)的轉(zhuǎn)換分之和為8分有7種結(jié)果,它們是:

則所求概率為.
題型四:綜合應(yīng)用題
【典例4-1】(2024·高三·浙江·開(kāi)學(xué)考試)一般地,元有序?qū)崝?shù)對(duì)稱(chēng)為維向量.對(duì)于兩個(gè)維向量,定義:兩點(diǎn)間距離,利用維向量的運(yùn)算可以解決許多統(tǒng)計(jì)學(xué)問(wèn)題.其中,依據(jù)“距離”分類(lèi)是一種常用的分類(lèi)方法:計(jì)算向量與每個(gè)標(biāo)準(zhǔn)點(diǎn)的距離,與哪個(gè)標(biāo)準(zhǔn)點(diǎn)的距離最近就歸為哪類(lèi).某公司對(duì)應(yīng)聘員工的不同方面能力進(jìn)行測(cè)試,得到業(yè)務(wù)能力分值 管理能力分值 計(jì)算機(jī)能力分值 溝通能力分值(分值代表要求度,1分最低,5分最高)并形成測(cè)試報(bào)告.不同崗位的具體要求見(jiàn)下表:
崗位 業(yè)務(wù)能力分值 管理能力分值 計(jì)算機(jī)能力分值 溝通能力分值 合計(jì)分值
會(huì)計(jì)(1) 2 1 5 4 12
業(yè)務(wù)員(2) 5 2 3 5 15
后勤(3) 2 3 5 3 13
管理員(4) 4 5 4 4 17
對(duì)應(yīng)聘者的能力報(bào)告進(jìn)行四維距離計(jì)算,可得到其最適合的崗位.設(shè)四種能力分值分別對(duì)應(yīng)四維向量的四個(gè)坐標(biāo).
(1)將這四個(gè)崗位合計(jì)分值從小到大排列得到一組數(shù)據(jù),直接寫(xiě)出這組數(shù)據(jù)的第三四分位數(shù);
(2)小剛與小明到該公司應(yīng)聘,已知:只有四個(gè)崗位的擬合距離的平方均小于20的應(yīng)聘者才能被招錄.
(i)小剛測(cè)試報(bào)告上的四種能力分值為,將這組數(shù)據(jù)看成四維向量中的一個(gè)點(diǎn),將四種職業(yè)的分值要求看成樣本點(diǎn),分析小剛最適合哪個(gè)崗位;
(ii)小明已經(jīng)被該公司招錄,其測(cè)試報(bào)告經(jīng)公司計(jì)算得到四種職業(yè)的推薦率分別為,試求小明的各項(xiàng)能力分值.
【解析】(1)將四個(gè)崗位合計(jì)分值從小到大排列得到數(shù)據(jù),
又,所以這組數(shù)據(jù)的第三四分位數(shù)為.
(2)(i)由圖表知,會(huì)計(jì)崗位的樣本點(diǎn)為,則,
業(yè)務(wù)員崗位的樣本點(diǎn)為,則,
后勤崗位的樣本點(diǎn)為,則,
管理員崗位的樣本點(diǎn)為,則,
所以,故小剛最適合業(yè)務(wù)員崗位.
(ii)四種職業(yè)的推薦率分別為,且,
所以,得到,
又均小于20,所以,且,
故可得到,
設(shè)小明業(yè)務(wù)能力分值、管理能力分值、計(jì)算機(jī)能力分值、溝通能力分值分別為,且,,
依題有①,
②,
③,
④,
由①③得,

整理得:,
故有三組正整數(shù)解,
對(duì)于第一組解,代入④式有,不成立;
對(duì)于第二組解,代入①式有,
解得或,代入②④式均不成立;
對(duì)于第三組解,代入②式有,
解得,代入①②③④均成立,故;
故小明業(yè)務(wù)能力分值、管理能力分值、計(jì)算機(jī)能力分值、溝通能力分值分別為.
【典例4-2】設(shè)離散型隨機(jī)變量X和Y有相同的可能取值,它們的分布列分別為,,,,.指標(biāo)可用來(lái)刻畫(huà)X和Y的相似程度,其定義為.設(shè).
(1)若,求;
(2)若,求的最小值;
(3)對(duì)任意與有相同可能取值的隨機(jī)變量,證明:,并指出取等號(hào)的充要條件
【解析】(1)不妨設(shè),則.
所以
.
(2)當(dāng)時(shí),,




令,則,
令,則,
當(dāng)時(shí),,單調(diào)遞減;
當(dāng)時(shí),,單調(diào)遞增;
所以,則單調(diào)遞增,而,
所以在為負(fù)數(shù),在為正數(shù),
則在單調(diào)遞減,在單調(diào)遞增,
所以的最小值為.
(3)令,則,
當(dāng)時(shí),,單調(diào)遞增;
當(dāng)時(shí),,單調(diào)遞減;
所以,即,當(dāng)且僅當(dāng)時(shí),等號(hào)成立,
則當(dāng)時(shí),,所以,即,
故,
當(dāng)且僅當(dāng)對(duì)所有的時(shí)等號(hào)成立.
【變式4-1】給定兩組數(shù)據(jù)與,稱(chēng)為這兩組數(shù)據(jù)之間的“差異量”.鑒寶類(lèi)的節(jié)目是當(dāng)下非常流行的綜藝節(jié)目.現(xiàn)有個(gè)古董,它們的價(jià)值各不相同,最值錢(qián)的古董記為1號(hào),第二值錢(qián)的古董記為2號(hào),以此類(lèi)推,則古董價(jià)值的真實(shí)排序?yàn)椋F(xiàn)在某專(zhuān)家在不知道古董真實(shí)排序的前提下,根據(jù)自己的經(jīng)驗(yàn)對(duì)這個(gè)古董的價(jià)值從高到低依次進(jìn)行重新排序?yàn)椋渲袨樵搶?zhuān)家給真實(shí)價(jià)值排第位古董的位次編號(hào),記,那么與的差異量可以有效反映一個(gè)專(zhuān)家的水平,該差異量越小說(shuō)明專(zhuān)家的鑒寶能力越強(qiáng).
(1)當(dāng)時(shí),求的所有可能取值;
(2)當(dāng)時(shí),求滿(mǎn)足的的個(gè)數(shù);
(3)現(xiàn)在有兩個(gè)專(zhuān)家甲、乙同時(shí)進(jìn)行鑒寶,已知專(zhuān)家甲的鑒定結(jié)果與真實(shí)價(jià)值的差異量為,專(zhuān)家甲與專(zhuān)家乙的鑒定結(jié)果的差異量為4,那么專(zhuān)家乙的鑒定結(jié)果與真實(shí)價(jià)值的差異量是否可能為?請(qǐng)說(shuō)明理由.
(注:實(shí)數(shù)滿(mǎn)足:,當(dāng)且僅當(dāng)時(shí)取“”號(hào))
【解析】(1)若時(shí),則,且,
可得,
所以的所有可能取值為0,2,4.
(2)若對(duì)調(diào)兩個(gè)位置的序號(hào)之差大于2,則,
可知只能調(diào)整兩次兩個(gè)連續(xù)序號(hào)或連續(xù)三個(gè)序號(hào)之間調(diào)整順序,
若調(diào)整兩次兩個(gè)連續(xù)序號(hào):則有,共有3種可能;
若連續(xù)三個(gè)序號(hào)之間調(diào)整順序,連續(xù)三個(gè)序號(hào)有:,共3組,
由(1)可知:每組均有3種可能滿(mǎn)足,可得共有種可能;
所以的個(gè)數(shù)為.
(3)不可能,理由如下:
設(shè)專(zhuān)家甲的排序?yàn)椋洠?br/>專(zhuān)家乙的排序?yàn)椋洠?br/>由題意可得:,,
因?yàn)椋?br/>結(jié)合的任意性可得,
所以專(zhuān)家乙的鑒定結(jié)果與真實(shí)價(jià)值I的差異量不可能為.
【變式4-2】將2024表示成7個(gè)正整數(shù)之和,得到方程①,稱(chēng)七元有序數(shù)組為方程①的解,對(duì)于上述的七元有序數(shù)組,當(dāng)時(shí),若),則稱(chēng)是密集的一組解.
(1)方程①是否存在一組解,使得等于同一常數(shù)
若存在,請(qǐng)求出該常數(shù),若不存在,請(qǐng)說(shuō)明理由;
(2)方程①的解中共有多少組是密集的
(3)記,問(wèn)S是否存在最小值 若存在,請(qǐng)求出S的最小值:若不存在,請(qǐng)說(shuō)明理由.
【解析】(1)若等于同一常數(shù),
根據(jù)等差數(shù)列的定義可得構(gòu)成等差數(shù)列,
所以,
解得,與矛盾,
所以不存在一組解,
使得等于同一常數(shù);
(2)因?yàn)槠骄鶖?shù),
依題意時(shí),即當(dāng)時(shí),,
所以,,
設(shè)有個(gè),則有個(gè),
由,解得,
所以中有個(gè),個(gè),
所以方程①的解共有組;
(3)因?yàn)槠骄鶖?shù),
又方差,即,
所以,因?yàn)闉槌?shù),所以當(dāng)方差取最小值時(shí)取最小值,
又當(dāng)時(shí),,
即,方程無(wú)正整數(shù)解,故舍去;
當(dāng)時(shí),即是密集時(shí),取得最小值,
且.
【變式4-3】已知數(shù)據(jù),,…,的平均數(shù)為,方差為,數(shù)據(jù),,…,的平均數(shù)為,方差為.類(lèi)似平面向量,定義n維向量,的模,,數(shù)量積.若向量與所成角為,有恒等式,其中,.
(1)當(dāng)時(shí),若向量,,求與所成角的余弦值;
(2)當(dāng)時(shí),證明:①;②;
(3)當(dāng),時(shí),探究與的大小關(guān)系,并證明.
【解析】(1);
(2)①當(dāng)時(shí),



(3),理由如下:
當(dāng),時(shí),

同理可得,

.
1.(2024·高三·北京豐臺(tái)·期末)市場(chǎng)占有率指在一定時(shí)期內(nèi),企業(yè)所生產(chǎn)的產(chǎn)品在其市場(chǎng)的銷(xiāo)售量(或銷(xiāo)售額)占同類(lèi)產(chǎn)品銷(xiāo)售量(或銷(xiāo)售額)的比重.一般來(lái)說(shuō),市場(chǎng)占有率會(huì)隨著市場(chǎng)的顧客流動(dòng)而發(fā)生變化,如果市場(chǎng)的顧客流動(dòng)趨向長(zhǎng)期穩(wěn)定,那么經(jīng)過(guò)一段時(shí)期以后的市場(chǎng)占有率將會(huì)出現(xiàn)穩(wěn)定的平衡狀態(tài)(即顧客的流動(dòng),不會(huì)影響市場(chǎng)占有率),此時(shí)的市場(chǎng)占有率稱(chēng)為“穩(wěn)定市場(chǎng)占有率”.有A,B,C三個(gè)企業(yè)都生產(chǎn)某產(chǎn)品,2022年第一季度它們的市場(chǎng)占有率分別為:40%,40%,20%.經(jīng)調(diào)查,2022年第二季度A,B,C三個(gè)企業(yè)之間的市場(chǎng)占有率轉(zhuǎn)移情況如圖所示,若該產(chǎn)品以后每個(gè)季度的市場(chǎng)占有率轉(zhuǎn)移情況均與2022年第二季度相同,則當(dāng)市場(chǎng)出現(xiàn)穩(wěn)定的平衡狀態(tài),最終達(dá)到“穩(wěn)定市場(chǎng)占有率”時(shí),A企業(yè)該產(chǎn)品的“穩(wěn)定市場(chǎng)占有率”為( )

A.45% B.48% C.50% D.52%
【答案】C
【解析】由題意,設(shè)最終達(dá)到“穩(wěn)定市場(chǎng)占有率”時(shí),A企業(yè)該產(chǎn)品的“穩(wěn)定市場(chǎng)占有率”為,B,C兩個(gè)企業(yè)的“穩(wěn)定市場(chǎng)占有率”為,
則,
故,即,
所以,解得.
故選:C.
2.(多選題)為了解決傳統(tǒng)的3D人臉識(shí)別方法中存在的不精確問(wèn)題,科學(xué)家提出了一種基于視頻分塊聚類(lèi)的格拉斯曼流形自動(dòng)識(shí)別系統(tǒng).規(guī)定:某區(qū)域內(nèi)的m個(gè)點(diǎn)的深度的均值,標(biāo)準(zhǔn)偏差為,深度的點(diǎn)視為孤立點(diǎn),下表給出了某區(qū)域內(nèi)的8個(gè)點(diǎn)的數(shù)據(jù),則( )
15.1 15.2 15.3 15.4 15.5 15.4 15.4 13.4
15.1 14.2 14.3 14.4 14.5 15.4 14.4 15.4
20 12 13 15 16 14 12 18
A. B. C.不是孤立點(diǎn) D.和是孤立點(diǎn)
【答案】BC
【解析】由題可得,B對(duì);
,A錯(cuò);
,,則,
,,所以,、都不是孤立點(diǎn),C對(duì),D錯(cuò).
故選:BC.
3.(2024·北京西城·二模)為研究中國(guó)工業(yè)機(jī)器人產(chǎn)量和銷(xiāo)量的變化規(guī)律,收集得到了年工業(yè)機(jī)器人的產(chǎn)量和銷(xiāo)量數(shù)據(jù),如下表所示.
年份
產(chǎn)量萬(wàn)臺(tái)
銷(xiāo)量萬(wàn)臺(tái)
記年工業(yè)機(jī)器人產(chǎn)量的中位數(shù)為,銷(xiāo)量的中位數(shù)為.定義產(chǎn)銷(xiāo)率為“”.
(1)從年中隨機(jī)取年,求工業(yè)機(jī)器人的產(chǎn)銷(xiāo)率大于的概率;
(2)從年這年中隨機(jī)取年,這年中有年工業(yè)機(jī)器人的產(chǎn)量不小于,有年工業(yè)機(jī)器人的銷(xiāo)量不小于.記,求的分布列和數(shù)學(xué)期望;
(3)從哪年開(kāi)始的連續(xù)年中隨機(jī)取年,工業(yè)機(jī)器人的產(chǎn)銷(xiāo)率超過(guò)的概率最小.結(jié)論不要求證明
【解析】(1)記事件為“工業(yè)機(jī)器人的產(chǎn)銷(xiāo)率大于”.
由表中數(shù)據(jù),工業(yè)機(jī)器人的產(chǎn)銷(xiāo)率大于的年份為年,年,年,年,共年.
所以.
(2)因?yàn)椋?br/>所以的所有可能的取值為;的所有可能的取值為.
所以的所有可能的取值為.
,,.
所以的分布列為:
故的數(shù)學(xué)期望.
(3)2018年和年.
4.(2024·福建泉州·模擬預(yù)測(cè))定義兩組數(shù)據(jù),的“斯皮爾曼系數(shù)”為變量在該組數(shù)據(jù)中的排名和變量在該組數(shù)據(jù)中的排名的樣本相關(guān)系數(shù),記為,其中.
某校15名學(xué)生的數(shù)學(xué)成績(jī)的排名與知識(shí)競(jìng)賽成績(jī)的排名如下表:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 5 3 4 9 8 7 6 10 2 12 14 13 11 15
(1)試求這15名學(xué)生的數(shù)學(xué)成績(jī)與知識(shí)競(jìng)賽成績(jī)的“斯皮爾曼系數(shù)”;
(2)已知在這15名學(xué)生中有10人數(shù)學(xué)成績(jī)優(yōu)秀,現(xiàn)從這15人中隨機(jī)抽取3人,抽到數(shù)學(xué)成績(jī)優(yōu)秀的學(xué)生有人,試求的分布列和數(shù)學(xué)期望.
【解析】(1)依題意,,
所以這15名學(xué)生的數(shù)學(xué)成績(jī)與知識(shí)競(jìng)賽成績(jī)的“斯皮爾曼系數(shù)”是0.8.
(2)依題意,的值可能為0,1,2,3,


則的分布列為:
0 1 2 3
所以的數(shù)學(xué)期望為.
5.(2024·安徽蕪湖·模擬預(yù)測(cè))安徽省從2024年起實(shí)施高考綜合改革,實(shí)行高考科目“”模式.“2”指考生從政法、地理、化學(xué)、生物四門(mén)學(xué)科中“再選”兩門(mén)學(xué)科,以等級(jí)分計(jì)入高考成績(jī).按照方案,再選學(xué)科的等級(jí)分賦分規(guī)則如下,將考生原始成績(jī)從高到低劃分為A,B,C,D,E五個(gè)等級(jí),各等級(jí)人數(shù)所占比例及賦分區(qū)間如表1:
表1
等級(jí) A B C D E
人數(shù)比例
賦分區(qū)間
將各等級(jí)內(nèi)考生的原始分依照等比例轉(zhuǎn)換法分別轉(zhuǎn)換到賦分區(qū)間內(nèi),得到等級(jí)分,轉(zhuǎn)換公式為,其中分別表示原始分區(qū)間的最低分和最高分,分別表示等級(jí)賦分區(qū)間的最低分和最高分,Y表示考生的原始分,T表示考生的等級(jí)賦分,計(jì)算結(jié)果四舍五入取整.若甲同學(xué)在五月全市模考中某選考科目成績(jī)信息如表2(本次考試成績(jī)均為自然數(shù))
表2
原始分 成績(jī)等級(jí) 原始分區(qū)間 等級(jí)分區(qū)間
75分 A等級(jí)
(1)求甲同學(xué)該科目的等級(jí)分;
(2)理論上當(dāng)原始分區(qū)間的極差越大時(shí),該區(qū)間中得分越低的同學(xué)賦分后等級(jí)分比原始分增加越多.比如某同學(xué)僅該科目較為薄弱,如果賦分后能比原始分增加9.5分以上(包含9.5分),那么六科總分排名相對(duì)于原始分排名就會(huì)有大幅提升,此時(shí)賦分制對(duì)于該同學(xué)就是有利的.經(jīng)過(guò)統(tǒng)計(jì)數(shù)據(jù),五月全市模擬考試該學(xué)科A等級(jí)的成績(jī)分布如表3.則如果從A等級(jí)的學(xué)生中隨機(jī)選出100名,X表示其中獲益于賦分政策的人數(shù),求的值.
表3
分?jǐn)?shù)段
人數(shù)比例
【解析】(1)由知得,
所以甲同學(xué)該科目的等級(jí)分為87分.
(2)由得,
該同學(xué)受益于賦分政策,則,即,取整得,
因?yàn)椋?br/>所以,故.
6.多樣性指數(shù)是生物群落中種類(lèi)與個(gè)體數(shù)的比值.在某個(gè)物種數(shù)目為的群落中,辛普森多樣性指數(shù),其中為第種生物的個(gè)體數(shù),為總個(gè)體數(shù).當(dāng)越大時(shí),表明該群落的多樣性越高.已知兩個(gè)實(shí)驗(yàn)水塘的構(gòu)成如下:
綠藻 衣藻 水綿 藍(lán)藻 硅藻
6 6 6 6 6
12 4 3 6 5
(1)若從中分別抽取一個(gè)生物個(gè)體,求兩個(gè)生物個(gè)體為同一物種的概率;
(2)(i)比較的多樣性大小;
(ii)根據(jù)(i)的計(jì)算結(jié)果,分析可能影響群落多樣性的因素.
【解析】(1)記事件為“兩個(gè)生物個(gè)體為同一物種”,
則發(fā)生的概率為.
(2)(i)由表可知
所以,;
即,故的多樣性大于;
(ii)在(i)中兩群落物種數(shù)目相同,各物種數(shù)量不同,而中各物種數(shù)量均相同,
即物種均勻度更大,分析可得物種均勻度也會(huì)影響群落多樣性.
7.從2021年秋季學(xué)期起,黑龍江省啟動(dòng)實(shí)施高考綜合改革,實(shí)行高考科目“3+1+2”模式.“3”指語(yǔ)文、數(shù)學(xué)、外語(yǔ)三門(mén)統(tǒng)考學(xué)科,以原始分?jǐn)?shù)計(jì)入高考成績(jī);“1”指考生從物理、歷史兩門(mén)學(xué)科中“首選”一門(mén)學(xué)科,以原始分?jǐn)?shù)計(jì)入高考成績(jī);“2”指考生從政治、地理、化學(xué)、生物四門(mén)學(xué)科中“再選”兩門(mén)學(xué)科,以等級(jí)分計(jì)入高考成績(jī).按照方案,再選學(xué)科的等級(jí)分賦分規(guī)則如下,將考生原始成績(jī)從高到低劃分為A,B,C,D,E五個(gè)等級(jí),各等級(jí)人數(shù)所占比例及賦分區(qū)間如下表:
等級(jí) A B C D E
人數(shù)比例
賦分區(qū)間
將各等級(jí)內(nèi)考生的原始分依照等比例轉(zhuǎn)換法分別轉(zhuǎn)換到賦分區(qū)間內(nèi),得到等級(jí)分,轉(zhuǎn)換公式為,其中分別表示原始分區(qū)間的最低分和最高分,分別表示等級(jí)賦分區(qū)間的最低分和最高分,表示考生的原始分,表示考生的等級(jí)分,規(guī)定原始分為時(shí),等級(jí)分為.某次化學(xué)考試的原始分最低分為50,最高分為98,呈連續(xù)整數(shù)分布,其頻率分布直方圖如下:
(1)根據(jù)頻率分布直方圖,求,并估計(jì)此次化學(xué)考試原始分的平均值;
(2)按照等級(jí)分賦分規(guī)則,估計(jì)此次考試化學(xué)成績(jī)A等級(jí)的原始分區(qū)間;
(3)用估計(jì)的結(jié)果近似代替原始分區(qū)間,若某學(xué)生化學(xué)成績(jī)的原始分為88,試計(jì)算其等級(jí)分(計(jì)算結(jié)果四舍五入取整).
【解析】(1)由,可得,
故此次化學(xué)考試成績(jī)的平均值為分
(2)由頻率分布直方圖知,原始分成績(jī)位于區(qū)間的占比為,位于區(qū)間的占比為,
因?yàn)槌煽?jī)A等級(jí)占比為,所以等級(jí)A的原始分區(qū)間的最低分位于區(qū)間,
估計(jì)等級(jí)A的原始分區(qū)間的最低分為,
已知最高分為98,所以估計(jì)此次考試化學(xué)成績(jī)A等級(jí)的原始分區(qū)間為.
(3)由,解得,該學(xué)生的等級(jí)分為89分.
8.(2024·全國(guó)·模擬預(yù)測(cè))某校20名學(xué)生的數(shù)學(xué)成績(jī)和知識(shí)競(jìng)賽成績(jī)?nèi)缦卤恚?br/>學(xué)生編號(hào) 1 2 3 4 5 6 7 8 9 10
數(shù)學(xué)成績(jī) 100 99 96 93 90 88 85 83 80 77
知識(shí)競(jìng)賽成績(jī) 290 160 220 200 65 70 90 100 60 270
學(xué)生編號(hào) 11 12 13 14 15 16 17 18 19 20
數(shù)學(xué)成績(jī) 75 74 72 70 68 66 60 50 39 35
知識(shí)競(jìng)賽成績(jī) 45 35 40 50 25 30 20 15 10 5
計(jì)算可得數(shù)學(xué)成績(jī)的平均值是,知識(shí)競(jìng)賽成績(jī)的平均值是,并且,,.
(1)求這組學(xué)生的數(shù)學(xué)成績(jī)和知識(shí)競(jìng)賽成績(jī)的樣本相關(guān)系數(shù)(精確到).
(2)設(shè),變量和變量的一組樣本數(shù)據(jù)為,其中兩兩不相同,兩兩不相同.記在中的排名是第位,在中的排名是第位,.定義變量和變量的“斯皮爾曼相關(guān)系數(shù)”(記為)為變量的排名和變量的排名的樣本相關(guān)系數(shù).
(i)記,.證明:.
(ii)用(i)的公式求這組學(xué)生的數(shù)學(xué)成績(jī)和知識(shí)競(jìng)賽成績(jī)的“斯皮爾曼相關(guān)系數(shù)”(精確到).
(3)比較(1)和(2)(ii)的計(jì)算結(jié)果,簡(jiǎn)述“斯皮爾曼相關(guān)系數(shù)”在分析線性相關(guān)性時(shí)的優(yōu)勢(shì).
注:參考公式與參考數(shù)據(jù).;;.
【解析】(1)由題意,這組學(xué)生數(shù)學(xué)成績(jī)和知識(shí)競(jìng)賽成績(jī)的樣本相關(guān)系數(shù)為
(2)(i)證明:因?yàn)楹投际?,2,,的一個(gè)排列,所以


從而和的平均數(shù)都是.
因此,,
同理可得,
由于,
所以;
(ii)由題目數(shù)據(jù),可寫(xiě)出與的值如下:
同學(xué)編號(hào) 1 2 3 4 5 6 7 8 9 10
數(shù)學(xué)成績(jī)排名 1 2 3 4 5 6 7 8 9 10
知識(shí)競(jìng)賽成績(jī)排名 1 5 3 4 9 8 7 6 10 2
同學(xué)編號(hào) 11 12 13 14 15 16 17 18 19 20
數(shù)學(xué)成績(jī)排名 11 12 13 14 15 16 17 18 19 20
知識(shí)競(jìng)賽成績(jī)排名 12 14 13 11 16 15 17 18 19 20
所以,并且.
因此這組學(xué)生的數(shù)學(xué)成績(jī)和知識(shí)競(jìng)賽成績(jī)的斯皮爾曼相關(guān)系數(shù)是
(3)答案①:斯皮爾曼相關(guān)系數(shù)對(duì)于異常值不太敏感,如果數(shù)據(jù)中有明顯的異常值,那么用斯皮爾曼相關(guān)系數(shù)比用樣本相關(guān)系數(shù)更能刻畫(huà)某種線性關(guān)系;
答案②:斯皮爾曼相關(guān)系數(shù)刻畫(huà)的是樣本數(shù)據(jù)排名的樣本相關(guān)系數(shù),與具體的數(shù)值無(wú)關(guān),只與排名有關(guān).如果一組數(shù)據(jù)有異常值,但排名依然符合一定的線性關(guān)系,則可以采用斯皮爾曼相關(guān)系數(shù)刻畫(huà)線性關(guān)系.
9.某種人臉識(shí)別方法,采用了視頻分塊聚類(lèi)的自動(dòng)識(shí)別系統(tǒng).規(guī)定:某區(qū)域內(nèi)的個(gè)點(diǎn)的深度的均值為,標(biāo)準(zhǔn)差為,深度的點(diǎn)視為孤立點(diǎn).下表給出某區(qū)域內(nèi)8個(gè)點(diǎn)的數(shù)據(jù):
15.1 15.2 15.3 15.4 15.5 15.4 15.4 13.8
15.1 14.2 14.3 14.4 14.5 15.4 14.4 15.4
20 12 13 15 16 14 12 18
(1)根據(jù)以上數(shù)據(jù),計(jì)算的值;
(2)判斷表中各點(diǎn)是否為孤立點(diǎn).
【解析】(1),
.
(2),,
則,
因?yàn)?2,13,14,15,16,18,20均屬于,所以各點(diǎn)都不是孤立點(diǎn).
10.(2024·江西吉安·一模)黨的二十大報(bào)告提出,要推進(jìn)健康中國(guó)建設(shè),把保障人民健康放在優(yōu)先發(fā)展的戰(zhàn)略位置,完善人民健康促進(jìn)政策.《國(guó)務(wù)院關(guān)于印發(fā)全民健身計(jì)劃(—年)的通知》中指出,深入實(shí)施健康中國(guó)戰(zhàn)略和全民健身國(guó)家戰(zhàn)略,加快體育強(qiáng)國(guó)建設(shè),構(gòu)建更高水平的全民健身公共服務(wù)體系,充分發(fā)揮全民健身在提高人民健康水平 促進(jìn)人的全面發(fā)展 推動(dòng)經(jīng)濟(jì)社會(huì)發(fā)展 展示國(guó)家文化軟實(shí)力等方面的綜合價(jià)值與多元功能.如圖為年~年(年的年份序號(hào)為)我國(guó)健身人數(shù)(百萬(wàn)人)變化情況的折線圖:
統(tǒng)計(jì)學(xué)中的樣本點(diǎn)具有二重性,樣本是可以觀測(cè)的隨機(jī)變量,本題將和視為兩個(gè)隨機(jī)變量且以上數(shù)據(jù)圖中的每個(gè)樣本點(diǎn)的產(chǎn)生的概率都是,已知,其中表示的平均數(shù).
參考數(shù)據(jù)及公式:.和兩個(gè)隨機(jī)變量之間的皮爾遜相關(guān)系數(shù)為,線性回歸方程中,.
(1)求回歸方程的皮爾遜相關(guān)系數(shù)(保留位有效數(shù)字);
(2)求關(guān)于的回歸方程.
【解析】(1)由折線圖可得:,,,,,
.
(2)設(shè)線性回歸方程為,
則,

關(guān)于的回歸方程為.
11.(2024·湖南郴州·三模)chatGPT是由OpenAI開(kāi)發(fā)的一款人工智能機(jī)器人程序,一經(jīng)推出就火遍全球.chatGPT的開(kāi)發(fā)主要采用RLHF(人類(lèi)反饋強(qiáng)化學(xué)習(xí))技術(shù),訓(xùn)練分為以下三個(gè)階段.
第一階段:訓(xùn)練監(jiān)督策略模型.對(duì)抽取的prompt數(shù)據(jù),人工進(jìn)行高質(zhì)量的回答,獲取數(shù)據(jù)對(duì),幫助數(shù)學(xué)模型GPT-3.5更好地理解指令.
第二階段:訓(xùn)練獎(jiǎng)勵(lì)模型.用上一階段訓(xùn)練好的數(shù)學(xué)模型,生成個(gè)不同的回答,人工標(biāo)注排名,通過(guò)獎(jiǎng)勵(lì)模型給出不同的數(shù)值,獎(jiǎng)勵(lì)數(shù)值越高越好.獎(jiǎng)勵(lì)數(shù)值可以通過(guò)最小化下面的交叉熵?fù)p失函數(shù)得到:,其中,且.
第三階段:實(shí)驗(yàn)與強(qiáng)化模型和算法.通過(guò)調(diào)整模型的參數(shù),使模型得到最大的獎(jiǎng)勵(lì)以符合人工的選擇取向.
參考數(shù)據(jù):
(1)若已知某單個(gè)樣本,其真實(shí)分布,其預(yù)測(cè)近似分布,計(jì)算該單個(gè)樣本的交叉熵?fù)p失函數(shù)Loss值.
(2)絕對(duì)值誤差MAE也是一種比較常見(jiàn)的損失函數(shù),現(xiàn)已知某階變量的絕對(duì)值誤差,,其中,表示變量的階.若已知某個(gè)樣本是一個(gè)三階變量的數(shù)陣,其真實(shí)分布是,現(xiàn)已知其預(yù)測(cè)分布為,求證:該變量的絕對(duì)值誤差為定值.
(3)在測(cè)試chatGPT時(shí),如果輸入問(wèn)題沒(méi)有語(yǔ)法錯(cuò)誤chatGPT的回答被采納的概率為,當(dāng)出現(xiàn)語(yǔ)法錯(cuò)誤時(shí),chatGPT的回答被采納的概率為.現(xiàn)已知輸入的問(wèn)題中出現(xiàn)語(yǔ)法錯(cuò)誤的概率為,現(xiàn)已知chatGPT的回答被采納,求該問(wèn)題的輸入語(yǔ)法沒(méi)有錯(cuò)誤的概率.
【解析】(1)由題意,該單個(gè)樣本的交叉嫡損失函數(shù):.
(2)根據(jù)定義,該三階變量的絕對(duì)值誤差為.
(3)記事件A:chatGPT中輸入的語(yǔ)法無(wú)錯(cuò)誤;事件B:chatGPT中輸入的語(yǔ)法有錯(cuò)誤;事件C:chatGPT的回答被采納.
依題意:,
所以.
12.某抽獎(jiǎng)系統(tǒng)中,抽得的物品可分為星,星和星,其中一種抽獎(jiǎng)種類(lèi)中的抽獎(jiǎng)系統(tǒng)的概率和相關(guān)保底機(jī)制如下:
物品類(lèi)別 星 星 星
基礎(chǔ)概率
基礎(chǔ)概率:在沒(méi)有任何其他機(jī)制的影響下,單次抽獎(jiǎng)抽中指定類(lèi)別獎(jiǎng)品的概率.
保底機(jī)制:現(xiàn)假定玩家從未進(jìn)行過(guò)抽獎(jiǎng),則玩家抽取星(或星)的概率會(huì)隨者未抽中星(或星)的次數(shù)增加而改變,相關(guān)機(jī)制如下表所示:
連續(xù)未抽中星的次數(shù)
下一次抽中星的概率
連續(xù)未抽中星的次數(shù)
下一次抽中星的概率
注:①表示,中的最小值:
②抽中星的概率和抽中星的概率的增加值從抽中星的概率中等量扣除;
③若發(fā)現(xiàn)下一次抽獎(jiǎng)中,抽中星的概率和抽中星的概率的和大于,則下一次抽獎(jiǎng)抽中星的概率等于表中的值(記為),而抽中星的概率為.
現(xiàn)記玩家獲得個(gè)星物品所需要的最大抽獎(jiǎng)次數(shù)為;
統(tǒng)計(jì)名玩家抽到第一個(gè)五星的總次數(shù)和中途抽到四星的次數(shù)如下表所示:
玩家序號(hào)
總次數(shù)
四星個(gè)數(shù)
計(jì)算得:,,,,已知與之間存在很強(qiáng)的線性相關(guān)關(guān)系,求出其線性回歸方程,并求出使得最小的(回歸方程中的和取兩位小數(shù))
參考公式:回歸直線方程斜率和截距的最小二乘估計(jì)公式分別為:,.
【解析】因?yàn)椋霐?shù)據(jù)得:,
所以,
所以y與x的線性回歸方程為.
當(dāng)連續(xù)未抽中5星的次數(shù),下一次抽中5星的概率為0.600%,
所以下一次可能抽不中5星;當(dāng)連續(xù)未抽中5星的次數(shù),
下一次抽中5星的概率0.600%,
由有:,
所以玩家獲得1個(gè)5星物品所需要的最大抽獎(jiǎng)次數(shù)為73.
所以,
由有:,
所以使得最小的x為8.
13.(2024·山西太原·三模)在學(xué)業(yè)測(cè)試中,客觀題難度的計(jì)算公式為,其中為第i題的難度,為答對(duì)該題的人數(shù),N為參加測(cè)試的總?cè)藬?shù).現(xiàn)對(duì)某校高三年級(jí)240名學(xué)生進(jìn)行一次測(cè)試,共5道客觀題.測(cè)試前根據(jù)對(duì)學(xué)生的了解,預(yù)估了每道題的難度,如下表所示:
題號(hào) 1 2 3 4 5
考前預(yù)估難度 0.9 0.8 0.7 0.6 0.4
測(cè)試后,隨機(jī)抽取了20名學(xué)生的答題數(shù)據(jù)進(jìn)行統(tǒng)計(jì),結(jié)果如下
題號(hào) 1 2 3 4 5
實(shí)測(cè)答對(duì)人數(shù) 16 16 14 14 8
(1)根據(jù)題中數(shù)據(jù),估計(jì)這240名學(xué)生中第5題的實(shí)測(cè)答對(duì)人數(shù);
(2)定義統(tǒng)計(jì)量,其中為第i題的實(shí)測(cè)難度,為第i題的預(yù)估難度(i=1,2,…,n).規(guī)定:若,則稱(chēng)該次測(cè)試的難度預(yù)估合理,否則為不合理.試據(jù)此判斷本次測(cè)試的難度預(yù)估是否合理.
【解析】(1)因?yàn)榈?題的實(shí)測(cè)難度為
所以估計(jì)這240名學(xué)生中第5題的實(shí)測(cè)答對(duì)人數(shù)為(人).
(2)根據(jù)題干中數(shù)據(jù)可得:,
故,
.
故本次測(cè)試的難度所估合理.
14.某校在學(xué)年期末舉行“我最喜歡的文化課”評(píng)選活動(dòng),投票規(guī)則是一人一票,高一(1)班44名學(xué)生和高一(7)班45名學(xué)生的投票結(jié)果如表(無(wú)廢票):
語(yǔ)文 數(shù)學(xué) 外語(yǔ) 物理 化學(xué) 生物 政治 歷史 地理
高一(1)班 6 9 7 5 4 5 3 3 2
高一(7)班 a 7 b 4 5 6 5 2 3
該校把上表的數(shù)據(jù)作為樣本,把兩個(gè)班同一學(xué)科的得票之和定義為該年級(jí)該學(xué)科的“好感指數(shù)”.
(1)如果數(shù)學(xué)學(xué)科的“好感指數(shù)”比高一年級(jí)其他文化課都高,求的所有取值;
(2)從高一(1)班投票給政治 歷史 地理的學(xué)生中任意選取3位同學(xué),設(shè)隨機(jī)變量X為投票給地理學(xué)科的人數(shù),求X的分布列和期望;
(3)當(dāng)a為何值時(shí),高一年級(jí)的語(yǔ)文 數(shù)學(xué) 外語(yǔ)三科的“好感指數(shù)”的方差最小?(結(jié)論不要求證明)
【解析】(1)由已知 ,所以.
依題意,
即 ,解得 ,又,
所以,,,,;
(2)由已知,隨機(jī)變量是高一(1)班同學(xué)中投票給地理學(xué)科的人數(shù),
所以

.
.
(3).
15.下表是中國(guó)近年來(lái)人口數(shù)據(jù)(不包括香港、澳門(mén)特別行政區(qū)和臺(tái)灣省):
年份 2013 2014 2015 2016
人口數(shù) 13.61億 13.68億 13.75億 13.83億
(1)在平面直角坐標(biāo)系內(nèi)標(biāo)出這四個(gè)點(diǎn),再把這些點(diǎn)連接成線;
(2)選擇其中合適的兩個(gè)點(diǎn),建立一次函數(shù)模擬,用模擬函數(shù)預(yù)測(cè)2017年中國(guó)人口數(shù);
(3)能否用“更好”的直線來(lái)模擬這組數(shù)據(jù)的變化?也就是說(shuō),能否確定,的值,使式子的值最小?(按如下步驟進(jìn)行預(yù)測(cè))
①化簡(jiǎn)S,使之成為字母的二次三項(xiàng)式;
②當(dāng)取何值時(shí)(設(shè)為),二次三項(xiàng)式S取最小值(設(shè)為),這里和都應(yīng)該是含字母的式子,且是字母的二次三項(xiàng)式;
③求的值,使取最小值;
④求出對(duì)應(yīng)于上述的值;
⑤用一次函數(shù)模擬數(shù)據(jù)的變化,用模擬函數(shù)預(yù)測(cè)2017年中國(guó)人口數(shù).
(4)把所得到的兩個(gè)預(yù)測(cè)數(shù)據(jù)和2017年中國(guó)實(shí)際人口數(shù)進(jìn)行比較.
【解析】(1)如圖所示:
(4)查閱可得2017人口總數(shù)為13.9億,比較可得第二種方法算的更準(zhǔn)確,誤差更小.
16.(2024·北京西城·一模)在測(cè)試中,客觀題難度的計(jì)算公式為,其中為第題的難度,為答對(duì)該題的人數(shù),為參加測(cè)試的總?cè)藬?shù)現(xiàn)對(duì)某校高三年級(jí)240名學(xué)生進(jìn)行一次測(cè)試,共5道客觀題測(cè)試前根據(jù)對(duì)學(xué)生的了解,預(yù)估了每道題的難度,如表所示:
題號(hào) 1 2 3 4 5
考前預(yù)估難度
測(cè)試后,隨機(jī)抽取了20名學(xué)生的答題數(shù)據(jù)進(jìn)行統(tǒng)計(jì),結(jié)果如下:
題號(hào) 1 2 3 4 5
實(shí)測(cè)答對(duì)人數(shù) 16 16 14 14 4
(1)根據(jù)題中數(shù)據(jù),估計(jì)這240名學(xué)生中第5題的實(shí)測(cè)答對(duì)人數(shù);
(2)從抽樣的20名學(xué)生中隨機(jī)抽取2名學(xué)生,記這2名學(xué)生中第5題答對(duì)的人數(shù)為,求的分布列和數(shù)學(xué)期望;
(3)試題的預(yù)估難度和實(shí)測(cè)難度之間會(huì)有偏差設(shè)為第題的實(shí)測(cè)難度,請(qǐng)用和設(shè)計(jì)一個(gè)統(tǒng)計(jì)量,并制定一個(gè)標(biāo)準(zhǔn)來(lái)判斷本次測(cè)試對(duì)難度的預(yù)估是否合理.
【解析】(1)因?yàn)?0人中答對(duì)第5題的人數(shù)為4人,因此第5題的實(shí)測(cè)難度為,
所以估計(jì)240人中有人實(shí)測(cè)答對(duì)第5題.
(2)的可能取值是0,1,2,
;;.
的分布列為:
0 1 2

(3)將抽樣的20名學(xué)生中第題的實(shí)測(cè)難度,作為240名學(xué)生第題的實(shí)測(cè)難度. 
定義統(tǒng)計(jì)量,
其中為第題的預(yù)估難度.
并規(guī)定:若,則稱(chēng)本次測(cè)試的難度預(yù)估合理,否則為不合理. 
.
因?yàn)椋?br/>所以該次測(cè)試的難度預(yù)估是合理的.
21世紀(jì)教育網(wǎng)(www.21cnjy.com)拔高點(diǎn)突破01 統(tǒng)計(jì)背景下的新定義問(wèn)題
目錄
01 方法技巧與總結(jié) 2
02 題型歸納與總結(jié) 3
題型一:新定義統(tǒng)計(jì)量或指標(biāo) 3
題型二:新定義的統(tǒng)計(jì)方法或技術(shù) 5
題型三:新定義的數(shù)據(jù)可視化方法 6
題型四:綜合應(yīng)用題 10
03 過(guò)關(guān)測(cè)試 13
針對(duì)高中數(shù)學(xué)統(tǒng)計(jì)背景下的新定義問(wèn)題,解題方法的總結(jié)可以從以下幾個(gè)方面進(jìn)行:
一、理解新定義的本質(zhì)
首先,需要明確題目中的新定義是針對(duì)統(tǒng)計(jì)中的某一概念、方法或運(yùn)算的拓展或創(chuàng)新。理解這一新定義的本質(zhì)屬性、條件、結(jié)論以及適用范圍是解題的第一步。這要求學(xué)生具備較強(qiáng)的閱讀理解能力和抽象思維能力,能夠快速準(zhǔn)確地把握新定義的核心內(nèi)容。
二、聯(lián)系已學(xué)知識(shí)
新定義問(wèn)題往往不是孤立存在的,它們往往與已學(xué)的統(tǒng)計(jì)知識(shí)有著緊密的聯(lián)系。因此,在理解新定義的基礎(chǔ)上,學(xué)生需要將其與已學(xué)的統(tǒng)計(jì)概念、方法或運(yùn)算進(jìn)行聯(lián)系,找到它們之間的共同點(diǎn)和不同點(diǎn)。這樣不僅可以幫助學(xué)生更好地理解新定義,還可以為后續(xù)的解題提供思路和方法。
三、構(gòu)建解題模型
對(duì)于統(tǒng)計(jì)背景下的新定義問(wèn)題,構(gòu)建解題模型是解決問(wèn)題的關(guān)鍵。學(xué)生需要根據(jù)題目的具體要求和已學(xué)知識(shí),構(gòu)建出適合解決該問(wèn)題的統(tǒng)計(jì)模型。這個(gè)模型可以是基于某種統(tǒng)計(jì)分布的假設(shè)檢驗(yàn)?zāi)P停部梢允腔跀?shù)據(jù)特征的描述統(tǒng)計(jì)模型。在構(gòu)建模型的過(guò)程中,學(xué)生需要充分考慮新定義的條件和結(jié)論,確保模型的準(zhǔn)確性和有效性。
四、運(yùn)用統(tǒng)計(jì)方法進(jìn)行計(jì)算和分析
在構(gòu)建好解題模型之后,學(xué)生需要運(yùn)用統(tǒng)計(jì)方法進(jìn)行計(jì)算和分析。這包括數(shù)據(jù)的收集、整理、描述、推斷等各個(gè)方面。在計(jì)算和分析的過(guò)程中,學(xué)生需要嚴(yán)格按照統(tǒng)計(jì)方法的步驟和要求進(jìn)行操作,確保結(jié)果的準(zhǔn)確性和可靠性。同時(shí),學(xué)生還需要注意對(duì)新定義條件的應(yīng)用和理解,確保計(jì)算和分析過(guò)程符合題目要求。
五、總結(jié)歸納
最后,學(xué)生需要對(duì)解題過(guò)程進(jìn)行總結(jié)歸納。這包括對(duì)新定義的理解和應(yīng)用情況的反思、對(duì)解題思路和方法的總結(jié)以及對(duì)統(tǒng)計(jì)知識(shí)的鞏固和拓展等方面。通過(guò)總結(jié)歸納,學(xué)生可以更好地掌握新定義問(wèn)題的解題方法,提高自己的統(tǒng)計(jì)素養(yǎng)和解題能力。
具體解題步驟建議
仔細(xì)閱讀題目:理解題目中的新定義及其條件、結(jié)論等要素。
聯(lián)系已學(xué)知識(shí):將新定義與已學(xué)的統(tǒng)計(jì)知識(shí)進(jìn)行聯(lián)系和對(duì)比,找到它們之間的共同點(diǎn)和不同點(diǎn)。
構(gòu)建解題模型:根據(jù)題目要求和已學(xué)知識(shí)構(gòu)建解題模型,明確模型的假設(shè)條件、計(jì)算步驟和分析方法。
進(jìn)行計(jì)算和分析:按照統(tǒng)計(jì)方法的步驟和要求進(jìn)行計(jì)算和分析,確保結(jié)果的準(zhǔn)確性和可靠性。
總結(jié)歸納:對(duì)解題過(guò)程進(jìn)行總結(jié)歸納,反思解題過(guò)程中的得失和體會(huì),鞏固和拓展自己的統(tǒng)計(jì)知識(shí)。
題型一:新定義統(tǒng)計(jì)量或指標(biāo)
【典例1-1】設(shè),,…,是總體數(shù)據(jù)中抽取的樣本,k為正整數(shù),則稱(chēng)為樣本k階中心矩,其中為樣本均值.統(tǒng)計(jì)學(xué)中,當(dāng)我們遇到數(shù)據(jù)分布形狀不對(duì)稱(chēng)時(shí),常用樣本中心矩的函數(shù)——樣本偏度來(lái)刻畫(huà)偏離方向與程度.若將樣本數(shù)據(jù),,…,繪制柱形圖如圖所示,則( )
2
A. B.
C. D.與0的大小關(guān)系不能確定
【典例1-2】定義空間直角坐標(biāo)系中的任意點(diǎn)的“數(shù)”為:在點(diǎn)的坐標(biāo)中不同數(shù)字的個(gè)數(shù),如:,點(diǎn)的坐標(biāo),則所有這些點(diǎn)的“數(shù)”的均值與最小值之差為 .
【變式1-1】(2024·河北·模擬預(yù)測(cè))機(jī)器模型預(yù)測(cè)常常用于只有正確與錯(cuò)誤兩種結(jié)果的問(wèn)題.表1為根據(jù)模型預(yù)測(cè)結(jié)果與真實(shí)情況的差距的情形表格,定義真正例率,假正例率.概率閾值為自行設(shè)定的用于判別正(反)例的值,若分類(lèi)器(分類(lèi)模型)對(duì)該樣例的預(yù)測(cè)正例概率大于等于設(shè)定的概率閾值,則記分類(lèi)器預(yù)測(cè)為正例,反之預(yù)測(cè)為反例.
總例 預(yù)測(cè)結(jié)果
正例 反例
真實(shí) 情況 正例 真正例 假反例
反例 假正例 真反例
表1分類(lèi)結(jié)果樣例劃分
利用這些指標(biāo)繪制出的ROC曲線可衡量模型的評(píng)價(jià)效果:將各樣例的預(yù)測(cè)正例概率與從大到小排序并依次作為概率閾值,分別計(jì)算相應(yīng)概率閾值下的與.以為橫坐標(biāo),為縱坐標(biāo),得到標(biāo)記點(diǎn).依次連接各標(biāo)記點(diǎn)得到的折線就是ROC曲線.圖1為甲分類(lèi)器對(duì)于8個(gè)樣例的ROC曲線,表2為甲,乙分類(lèi)器對(duì)于相同8個(gè)樣例的預(yù)測(cè)數(shù)據(jù).
樣例數(shù)據(jù) 甲分 類(lèi)器 乙分 類(lèi)器
樣例 標(biāo)號(hào) 樣例 屬性 預(yù)測(cè)正 例概率 預(yù)測(cè)正 例概率
1 正例 0.23 0.34
2 正例 0.58 0.53
3 反例 0.15 0.13
4 反例 0.62 0.39
5 正例 0.47 0.87
6 反例 0.47 0.53
7 反例 0.33 0.11
8 正例 0.77 0.63
表2甲,乙分類(lèi)器對(duì)于相同8個(gè)樣例的預(yù)測(cè)數(shù)據(jù)

(1)當(dāng)概率閾值為0.47時(shí),求甲分類(lèi)器的ROC曲線中的對(duì)應(yīng)點(diǎn);
(2)在圖2中繪制乙分類(lèi)器對(duì)應(yīng)的ROC曲線(無(wú)需說(shuō)明繪圖過(guò)程),并直接寫(xiě)出甲,乙兩分類(lèi)器的ROC曲線與軸,直線所圍封閉圖形的面積;
(3)按照上述思路,比較甲,乙兩分類(lèi)器的預(yù)測(cè)效果,并直接寫(xiě)出理想分類(lèi)器的ROC曲線與軸,直線所圍封閉圖形的面積為1的充要條件.
題型二:新定義的統(tǒng)計(jì)方法或技術(shù)
【典例2-1】(2024·河北衡水·一模)為檢測(cè)出新冠肺炎的感染者,醫(yī)學(xué)上可采用“二分檢測(cè)法”,假設(shè)待檢測(cè)的總?cè)藬?shù)是,將個(gè)人的樣本混合在一起做第1輪檢測(cè)(檢測(cè)一次),如果檢測(cè)結(jié)果為陰性,可確定這批人未感染;如果檢測(cè)結(jié)果為陽(yáng)性,可確定其中有感染者,則將這批人平均分為兩組,每組人的樣本混合在一起做第2輪檢測(cè),每組檢測(cè)1次,如此類(lèi)推,每輪檢測(cè)后,排除結(jié)果為陰性的那組人,而將每輪檢測(cè)后結(jié)果為陽(yáng)性的組再平均分成兩組,做下一輪檢測(cè),直到檢測(cè)出所有感染者(感染者必須通過(guò)檢測(cè)來(lái)確定),若待檢測(cè)的總?cè)藬?shù)為8,采用“二分檢測(cè)法”構(gòu)測(cè),經(jīng)過(guò)4輪共7次檢測(cè)后確定了所有感染者,則感染者人數(shù)的所有可能值為 人.若待檢測(cè)的總?cè)藬?shù)為,且假設(shè)其中有2名感染者,采用“二分檢測(cè)法”所需檢測(cè)總次數(shù)記為n,則n的最大值為 .
【典例2-2】已知數(shù)據(jù)的平均數(shù)為,設(shè)為該組數(shù)據(jù)的“階方差”,若,則與的大小關(guān)系為( )
A. B. C. D.與奇偶性有關(guān)
【變式2-1】已知樣本的平均數(shù)為,設(shè)為該樣本的“階方差”,則( )
A.
B.對(duì)任意恒成立
C.當(dāng)為奇數(shù)時(shí),不可能為負(fù)數(shù)
D.若,則
【變式2-2】(多選題)(2024·高三·湖北·期中)基于小汽車(chē)的“車(chē)均擁堵指數(shù)”,其取值范圍是,值越大表明擁堵程度越強(qiáng)烈.在這個(gè)公式中,為路段上統(tǒng)計(jì)時(shí)間間隔內(nèi)車(chē)輛平均行駛速度,為路段上自由流狀態(tài)下車(chē)輛行駛速度,且結(jié)合地圖匹配算法可得到,其中表示浮動(dòng)車(chē)的速度.下列說(shuō)法正確的是( )
A.的值越大,的值越小
B.若,則去掉后得到的的值變小
C.若,則去掉后得到的的值不變
D.若,則樣本的方差小于樣本的方差
【變式2-3】(多選題)(2024·河北邯鄲·三模)為了估計(jì)一批產(chǎn)品的不合格品率,現(xiàn)從這批產(chǎn)品中隨機(jī)抽取一個(gè)樣本容量為的樣本,定義,于是,,,記(其中或1,),稱(chēng)表示為參數(shù)的似然函數(shù).極大似然估計(jì)法是建立在極大似然原理基礎(chǔ)上的一個(gè)統(tǒng)計(jì)方法,極大似然原理的直觀想法是:一個(gè)隨機(jī)試驗(yàn)如有若干個(gè)可能的結(jié)果A,B,C,…,若在一次試驗(yàn)中,結(jié)果A出現(xiàn),則一般認(rèn)為試驗(yàn)條件對(duì)A出現(xiàn)有利,也即A出現(xiàn)的概率很大. 極大似然估計(jì)是一種用給定觀察數(shù)據(jù)來(lái)評(píng)估模型參數(shù)的統(tǒng)計(jì)方法,即“模型已定,參數(shù)未知”,通過(guò)若干次試驗(yàn),觀察其結(jié)果,利用試驗(yàn)結(jié)果得到某個(gè)參數(shù)值能夠使樣本出現(xiàn)的概率為最大.根據(jù)以上原理,下面說(shuō)法正確的是( )
A.有外形完全相同的兩個(gè)箱子,甲箱有99個(gè)白球1個(gè)黑球,乙箱有1個(gè)白球99個(gè)黑球.今隨機(jī)地抽取一箱,再?gòu)娜〕龅囊幌渲谐槿∫磺颍Y(jié)果取得白球,那么該球一定是從甲箱子中抽出的
B.一個(gè)池塘里面有鯉魚(yú)和草魚(yú),打撈了100條魚(yú),其中鯉魚(yú)80條,草魚(yú)20條,那么推測(cè)鯉魚(yú)和草魚(yú)的比例為4:1時(shí),出現(xiàn)80條鯉魚(yú)、20條草魚(yú)的概率是最大的
C.
D.達(dá)到極大值時(shí),參數(shù)的極大似然估計(jì)值為
題型三:新定義的數(shù)據(jù)可視化方法
【典例3-1】 2021年,小李老師的親戚準(zhǔn)備購(gòu)買(mǎi)一輛新的卡車(chē)用來(lái)跑運(yùn)輸,可選的車(chē)型主要有種.分別為,,,,現(xiàn)在有個(gè)指標(biāo):維修期限,百升汽油里數(shù),最大載重噸數(shù),價(jià)格,可能性,靈敏性來(lái)衡量,其中可靠性和靈敏性為評(píng)分,如下表.為了統(tǒng)一標(biāo)準(zhǔn)用來(lái)分析比較,小李老師將數(shù)據(jù)做了以下處理:.(表示第行第列的原始數(shù)據(jù),表示第行第列的原始數(shù)據(jù)處理后的數(shù)據(jù),表示第列的原始數(shù)據(jù))
如果用綜合指標(biāo)來(lái)做標(biāo)準(zhǔn),則的綜合指標(biāo)為( )
A. B. C. D.
【典例3-2】(2024·四川涼山·二模)高三模擬考試常常劃定的總分各批次分?jǐn)?shù)線,通過(guò)一定的數(shù)學(xué)模型,確定不同學(xué)科在一本、二本等各批次“學(xué)科上線有雙分”的分?jǐn)?shù)線.考生總成績(jī)達(dá)到總分各批次分?jǐn)?shù)線的稱(chēng)為總分上線;考生某一單科成績(jī)達(dá)到及學(xué)科上線有雙分的稱(chēng)為單科上線.學(xué)科對(duì)總分的貢獻(xiàn)或匹配程度評(píng)價(jià)有很大的意義.利用“學(xué)科對(duì)總分上線貢獻(xiàn)率”和“學(xué)科有效分上線命中率”這兩項(xiàng)評(píng)價(jià)指標(biāo),來(lái)反映各學(xué)科的單科成績(jī)對(duì)考生總分上線的貢獻(xiàn)與匹配程度,這對(duì)有效安排備考復(fù)習(xí)計(jì)劃具有十分重要的意義.某州一診考試劃定總分一本線為465分,數(shù)學(xué)一本線為104分,某班一小組的總分和數(shù)學(xué)成績(jī)?nèi)绫恚瑒t該小組“數(shù)學(xué)學(xué)科對(duì)總分上線貢獻(xiàn)率、有效分上線命中率”分別是( )(結(jié)果保留到小數(shù)點(diǎn)后一位有效數(shù)字)
學(xué)生編號(hào) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
數(shù)學(xué)成績(jī) 120 117 122 101 100 112 99 111 102 100 89 98 92 84 94 113 97 104 85 85
總分成績(jī) 495 494 493 485 483 483 482 480 479 475 471 470 463 457 454 453 448 448 441 440
A.41.7%,71.4% B.60%,71.4%
C.41.7%,35% D.60%,35%
【變式3-1】某省新高考中選考科目采用賦分制,具體轉(zhuǎn)換規(guī)則和步驟如下:第一步,按照考生原始分從高到低按成績(jī)比例劃定、、、、共五個(gè)等級(jí)(見(jiàn)下表).第二步,將至五個(gè)等級(jí)內(nèi)的考生原始分,依照等比例轉(zhuǎn)換法則,分別對(duì)應(yīng)轉(zhuǎn)換到100~86、85~71、70~56、55~41和40~30五個(gè)分?jǐn)?shù)段,從而將考生的等級(jí)轉(zhuǎn)換成了等級(jí)分.
等級(jí)
比例 15% 35% 35% 13% 2%
賦分區(qū)間 100-86 85-71 70-56 55-41 40-30
賦分公式:,計(jì)算出來(lái)的經(jīng)過(guò)四舍五人后即為賦分成績(jī).
某次考試,化學(xué)成績(jī)等級(jí)的原始最高分為98分,最低分為63分.學(xué)生甲化學(xué)原始成績(jī)?yōu)?6分,則該學(xué)生的化學(xué)賦分分?jǐn)?shù)為( )
A.85 B.88 C.91 D.95
【變式3-2】某公司有甲乙兩條生產(chǎn)線生產(chǎn)同一種產(chǎn)品,為了解產(chǎn)品的質(zhì)量情況,對(duì)兩條生產(chǎn)線生產(chǎn)的產(chǎn)品進(jìn)行簡(jiǎn)單隨機(jī)抽樣,經(jīng)檢測(cè)得到了A、B的兩項(xiàng)質(zhì)量指標(biāo)值,記為,定義產(chǎn)品的指標(biāo)偏差,數(shù)據(jù)如下表:
甲生產(chǎn)線抽樣產(chǎn)品編號(hào) 指標(biāo) 1 2 3 4 5 6 7 8 9 10
0.98 0.96 1.07 1.02 0.99 0.93 0.92 0.96 1.11 1.02
2.01 1.97 1.96 2.03 2.04 1.98 1.95 1.99 2.07 2.02
0.03 0.07 0.11 0.05 0.05 0.09 0.13 0.05 0.18 0.04
乙生產(chǎn)線抽樣產(chǎn)品編號(hào) 指標(biāo) 1 2 3 4 5 6 7 8
1.02 0.97 0.95 0.94 1.13 0.98 0.97 1.01
2.01 2.03 2.15 1.93 2.01 2.02 2.19 2.04
0.03 0.06 0.20 0.13 0.14 0.04 0.22 0.05
假設(shè)用頻率估計(jì)概率,且每件產(chǎn)品的質(zhì)量相互獨(dú)立.
(1)從甲生產(chǎn)線上隨機(jī)抽取一件產(chǎn)品,估計(jì)該產(chǎn)品滿(mǎn)足且的概率;
(2)從甲乙兩條生產(chǎn)線上各隨機(jī)抽取一件產(chǎn)品,設(shè)表示這兩件產(chǎn)品中滿(mǎn)足的產(chǎn)品數(shù),求的分布列和數(shù)學(xué)期望;
(3)已知的值越小則該產(chǎn)品質(zhì)量越好.如果甲乙兩條生產(chǎn)線各生產(chǎn)一件產(chǎn)品,根據(jù)現(xiàn)有數(shù)據(jù)判斷哪條生產(chǎn)線上的產(chǎn)品質(zhì)量更好?并說(shuō)明理由.
【變式3-3】定義:為不超過(guò)的最大整數(shù)部分,如,.甲、乙兩個(gè)學(xué)生高二的6次數(shù)學(xué)測(cè)試成績(jī)(測(cè)試時(shí)間為90分鐘,滿(mǎn)分100分)如下表所示:
高二成績(jī) 第1次考試 第2次考試 第3次考試 第4次考試 第5次考試 第6次考試
甲 68 74 77 84 88 95
乙 71 75 82 84 86 94
進(jìn)入高三后,由于改進(jìn)了學(xué)習(xí)方法,甲、乙這兩個(gè)學(xué)生的數(shù)學(xué)測(cè)試成績(jī)預(yù)計(jì)有了大的提升.設(shè)甲或乙高二的數(shù)學(xué)測(cè)試成績(jī)?yōu)椋簦瑒t甲或乙高三的數(shù)學(xué)測(cè)試成績(jī)預(yù)計(jì)為;若,則甲或乙高三的數(shù)學(xué)測(cè)試成績(jī)預(yù)計(jì)為100.
(1)試預(yù)測(cè):在將要進(jìn)行的高三6次數(shù)學(xué)測(cè)試成績(jī)(測(cè)試時(shí)間為90分鐘,滿(mǎn)分100分)中,甲、乙兩個(gè)學(xué)生的成績(jī)(填入下列表格內(nèi));
高三成績(jī) 第1次考試 第2次考試 第3次考試 第4次考試 第5次考試 第6次考試


(2)記高三任意一次數(shù)學(xué)測(cè)試成績(jī)估計(jì)值為,規(guī)定:,記為轉(zhuǎn)換分為3分;,記為轉(zhuǎn)換分為4分;,記為轉(zhuǎn)換分為5分.現(xiàn)從乙的6次數(shù)學(xué)測(cè)試成績(jī)中任意抽取2次,求這2次成績(jī)的轉(zhuǎn)換分之和為8分的概率.
題型四:綜合應(yīng)用題
【典例4-1】(2024·高三·浙江·開(kāi)學(xué)考試)一般地,元有序?qū)崝?shù)對(duì)稱(chēng)為維向量.對(duì)于兩個(gè)維向量,定義:兩點(diǎn)間距離,利用維向量的運(yùn)算可以解決許多統(tǒng)計(jì)學(xué)問(wèn)題.其中,依據(jù)“距離”分類(lèi)是一種常用的分類(lèi)方法:計(jì)算向量與每個(gè)標(biāo)準(zhǔn)點(diǎn)的距離,與哪個(gè)標(biāo)準(zhǔn)點(diǎn)的距離最近就歸為哪類(lèi).某公司對(duì)應(yīng)聘員工的不同方面能力進(jìn)行測(cè)試,得到業(yè)務(wù)能力分值 管理能力分值 計(jì)算機(jī)能力分值 溝通能力分值(分值代表要求度,1分最低,5分最高)并形成測(cè)試報(bào)告.不同崗位的具體要求見(jiàn)下表:
崗位 業(yè)務(wù)能力分值 管理能力分值 計(jì)算機(jī)能力分值 溝通能力分值 合計(jì)分值
會(huì)計(jì)(1) 2 1 5 4 12
業(yè)務(wù)員(2) 5 2 3 5 15
后勤(3) 2 3 5 3 13
管理員(4) 4 5 4 4 17
對(duì)應(yīng)聘者的能力報(bào)告進(jìn)行四維距離計(jì)算,可得到其最適合的崗位.設(shè)四種能力分值分別對(duì)應(yīng)四維向量的四個(gè)坐標(biāo).
(1)將這四個(gè)崗位合計(jì)分值從小到大排列得到一組數(shù)據(jù),直接寫(xiě)出這組數(shù)據(jù)的第三四分位數(shù);
(2)小剛與小明到該公司應(yīng)聘,已知:只有四個(gè)崗位的擬合距離的平方均小于20的應(yīng)聘者才能被招錄.
(i)小剛測(cè)試報(bào)告上的四種能力分值為,將這組數(shù)據(jù)看成四維向量中的一個(gè)點(diǎn),將四種職業(yè)的分值要求看成樣本點(diǎn),分析小剛最適合哪個(gè)崗位;
(ii)小明已經(jīng)被該公司招錄,其測(cè)試報(bào)告經(jīng)公司計(jì)算得到四種職業(yè)的推薦率分別為,試求小明的各項(xiàng)能力分值.
【典例4-2】設(shè)離散型隨機(jī)變量X和Y有相同的可能取值,它們的分布列分別為,,,,.指標(biāo)可用來(lái)刻畫(huà)X和Y的相似程度,其定義為.設(shè).
(1)若,求;
(2)若,求的最小值;
(3)對(duì)任意與有相同可能取值的隨機(jī)變量,證明:,并指出取等號(hào)的充要條件
【變式4-1】給定兩組數(shù)據(jù)與,稱(chēng)為這兩組數(shù)據(jù)之間的“差異量”.鑒寶類(lèi)的節(jié)目是當(dāng)下非常流行的綜藝節(jié)目.現(xiàn)有個(gè)古董,它們的價(jià)值各不相同,最值錢(qián)的古董記為1號(hào),第二值錢(qián)的古董記為2號(hào),以此類(lèi)推,則古董價(jià)值的真實(shí)排序?yàn)椋F(xiàn)在某專(zhuān)家在不知道古董真實(shí)排序的前提下,根據(jù)自己的經(jīng)驗(yàn)對(duì)這個(gè)古董的價(jià)值從高到低依次進(jìn)行重新排序?yàn)椋渲袨樵搶?zhuān)家給真實(shí)價(jià)值排第位古董的位次編號(hào),記,那么與的差異量可以有效反映一個(gè)專(zhuān)家的水平,該差異量越小說(shuō)明專(zhuān)家的鑒寶能力越強(qiáng).
(1)當(dāng)時(shí),求的所有可能取值;
(2)當(dāng)時(shí),求滿(mǎn)足的的個(gè)數(shù);
(3)現(xiàn)在有兩個(gè)專(zhuān)家甲、乙同時(shí)進(jìn)行鑒寶,已知專(zhuān)家甲的鑒定結(jié)果與真實(shí)價(jià)值的差異量為,專(zhuān)家甲與專(zhuān)家乙的鑒定結(jié)果的差異量為4,那么專(zhuān)家乙的鑒定結(jié)果與真實(shí)價(jià)值的差異量是否可能為?請(qǐng)說(shuō)明理由.
(注:實(shí)數(shù)滿(mǎn)足:,當(dāng)且僅當(dāng)時(shí)取“”號(hào))
【變式4-2】將2024表示成7個(gè)正整數(shù)之和,得到方程①,稱(chēng)七元有序數(shù)組為方程①的解,對(duì)于上述的七元有序數(shù)組,當(dāng)時(shí),若),則稱(chēng)是密集的一組解.
(1)方程①是否存在一組解,使得等于同一常數(shù)
若存在,請(qǐng)求出該常數(shù),若不存在,請(qǐng)說(shuō)明理由;
(2)方程①的解中共有多少組是密集的
(3)記,問(wèn)S是否存在最小值 若存在,請(qǐng)求出S的最小值:若不存在,請(qǐng)說(shuō)明理由.
【變式4-3】已知數(shù)據(jù),,…,的平均數(shù)為,方差為,數(shù)據(jù),,…,的平均數(shù)為,方差為.類(lèi)似平面向量,定義n維向量,的模,,數(shù)量積.若向量與所成角為,有恒等式,其中,.
(1)當(dāng)時(shí),若向量,,求與所成角的余弦值;
(2)當(dāng)時(shí),證明:①;②;
(3)當(dāng),時(shí),探究與的大小關(guān)系,并證明.
1.(2024·高三·北京豐臺(tái)·期末)市場(chǎng)占有率指在一定時(shí)期內(nèi),企業(yè)所生產(chǎn)的產(chǎn)品在其市場(chǎng)的銷(xiāo)售量(或銷(xiāo)售額)占同類(lèi)產(chǎn)品銷(xiāo)售量(或銷(xiāo)售額)的比重.一般來(lái)說(shuō),市場(chǎng)占有率會(huì)隨著市場(chǎng)的顧客流動(dòng)而發(fā)生變化,如果市場(chǎng)的顧客流動(dòng)趨向長(zhǎng)期穩(wěn)定,那么經(jīng)過(guò)一段時(shí)期以后的市場(chǎng)占有率將會(huì)出現(xiàn)穩(wěn)定的平衡狀態(tài)(即顧客的流動(dòng),不會(huì)影響市場(chǎng)占有率),此時(shí)的市場(chǎng)占有率稱(chēng)為“穩(wěn)定市場(chǎng)占有率”.有A,B,C三個(gè)企業(yè)都生產(chǎn)某產(chǎn)品,2022年第一季度它們的市場(chǎng)占有率分別為:40%,40%,20%.經(jīng)調(diào)查,2022年第二季度A,B,C三個(gè)企業(yè)之間的市場(chǎng)占有率轉(zhuǎn)移情況如圖所示,若該產(chǎn)品以后每個(gè)季度的市場(chǎng)占有率轉(zhuǎn)移情況均與2022年第二季度相同,則當(dāng)市場(chǎng)出現(xiàn)穩(wěn)定的平衡狀態(tài),最終達(dá)到“穩(wěn)定市場(chǎng)占有率”時(shí),A企業(yè)該產(chǎn)品的“穩(wěn)定市場(chǎng)占有率”為( )

A.45% B.48% C.50% D.52%
2.(多選題)為了解決傳統(tǒng)的3D人臉識(shí)別方法中存在的不精確問(wèn)題,科學(xué)家提出了一種基于視頻分塊聚類(lèi)的格拉斯曼流形自動(dòng)識(shí)別系統(tǒng).規(guī)定:某區(qū)域內(nèi)的m個(gè)點(diǎn)的深度的均值,標(biāo)準(zhǔn)偏差為,深度的點(diǎn)視為孤立點(diǎn),下表給出了某區(qū)域內(nèi)的8個(gè)點(diǎn)的數(shù)據(jù),則( )
15.1 15.2 15.3 15.4 15.5 15.4 15.4 13.4
15.1 14.2 14.3 14.4 14.5 15.4 14.4 15.4
20 12 13 15 16 14 12 18
A. B. C.不是孤立點(diǎn) D.和是孤立點(diǎn)
3.(2024·北京西城·二模)為研究中國(guó)工業(yè)機(jī)器人產(chǎn)量和銷(xiāo)量的變化規(guī)律,收集得到了年工業(yè)機(jī)器人的產(chǎn)量和銷(xiāo)量數(shù)據(jù),如下表所示.
年份
產(chǎn)量萬(wàn)臺(tái)
銷(xiāo)量萬(wàn)臺(tái)
記年工業(yè)機(jī)器人產(chǎn)量的中位數(shù)為,銷(xiāo)量的中位數(shù)為.定義產(chǎn)銷(xiāo)率為“”.
(1)從年中隨機(jī)取年,求工業(yè)機(jī)器人的產(chǎn)銷(xiāo)率大于的概率;
(2)從年這年中隨機(jī)取年,這年中有年工業(yè)機(jī)器人的產(chǎn)量不小于,有年工業(yè)機(jī)器人的銷(xiāo)量不小于.記,求的分布列和數(shù)學(xué)期望;
(3)從哪年開(kāi)始的連續(xù)年中隨機(jī)取年,工業(yè)機(jī)器人的產(chǎn)銷(xiāo)率超過(guò)的概率最小.結(jié)論不要求證明
4.(2024·福建泉州·模擬預(yù)測(cè))定義兩組數(shù)據(jù),的“斯皮爾曼系數(shù)”為變量在該組數(shù)據(jù)中的排名和變量在該組數(shù)據(jù)中的排名的樣本相關(guān)系數(shù),記為,其中.
某校15名學(xué)生的數(shù)學(xué)成績(jī)的排名與知識(shí)競(jìng)賽成績(jī)的排名如下表:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 5 3 4 9 8 7 6 10 2 12 14 13 11 15
(1)試求這15名學(xué)生的數(shù)學(xué)成績(jī)與知識(shí)競(jìng)賽成績(jī)的“斯皮爾曼系數(shù)”;
(2)已知在這15名學(xué)生中有10人數(shù)學(xué)成績(jī)優(yōu)秀,現(xiàn)從這15人中隨機(jī)抽取3人,抽到數(shù)學(xué)成績(jī)優(yōu)秀的學(xué)生有人,試求的分布列和數(shù)學(xué)期望.
5.(2024·安徽蕪湖·模擬預(yù)測(cè))安徽省從2024年起實(shí)施高考綜合改革,實(shí)行高考科目“”模式.“2”指考生從政法、地理、化學(xué)、生物四門(mén)學(xué)科中“再選”兩門(mén)學(xué)科,以等級(jí)分計(jì)入高考成績(jī).按照方案,再選學(xué)科的等級(jí)分賦分規(guī)則如下,將考生原始成績(jī)從高到低劃分為A,B,C,D,E五個(gè)等級(jí),各等級(jí)人數(shù)所占比例及賦分區(qū)間如表1:
表1
等級(jí) A B C D E
人數(shù)比例
賦分區(qū)間
將各等級(jí)內(nèi)考生的原始分依照等比例轉(zhuǎn)換法分別轉(zhuǎn)換到賦分區(qū)間內(nèi),得到等級(jí)分,轉(zhuǎn)換公式為,其中分別表示原始分區(qū)間的最低分和最高分,分別表示等級(jí)賦分區(qū)間的最低分和最高分,Y表示考生的原始分,T表示考生的等級(jí)賦分,計(jì)算結(jié)果四舍五入取整.若甲同學(xué)在五月全市模考中某選考科目成績(jī)信息如表2(本次考試成績(jī)均為自然數(shù))
表2
原始分 成績(jī)等級(jí) 原始分區(qū)間 等級(jí)分區(qū)間
75分 A等級(jí)
(1)求甲同學(xué)該科目的等級(jí)分;
(2)理論上當(dāng)原始分區(qū)間的極差越大時(shí),該區(qū)間中得分越低的同學(xué)賦分后等級(jí)分比原始分增加越多.比如某同學(xué)僅該科目較為薄弱,如果賦分后能比原始分增加9.5分以上(包含9.5分),那么六科總分排名相對(duì)于原始分排名就會(huì)有大幅提升,此時(shí)賦分制對(duì)于該同學(xué)就是有利的.經(jīng)過(guò)統(tǒng)計(jì)數(shù)據(jù),五月全市模擬考試該學(xué)科A等級(jí)的成績(jī)分布如表3.則如果從A等級(jí)的學(xué)生中隨機(jī)選出100名,X表示其中獲益于賦分政策的人數(shù),求的值.
表3
分?jǐn)?shù)段
人數(shù)比例
6.多樣性指數(shù)是生物群落中種類(lèi)與個(gè)體數(shù)的比值.在某個(gè)物種數(shù)目為的群落中,辛普森多樣性指數(shù),其中為第種生物的個(gè)體數(shù),為總個(gè)體數(shù).當(dāng)越大時(shí),表明該群落的多樣性越高.已知兩個(gè)實(shí)驗(yàn)水塘的構(gòu)成如下:
綠藻 衣藻 水綿 藍(lán)藻 硅藻
6 6 6 6 6
12 4 3 6 5
(1)若從中分別抽取一個(gè)生物個(gè)體,求兩個(gè)生物個(gè)體為同一物種的概率;
(2)(i)比較的多樣性大小;
(ii)根據(jù)(i)的計(jì)算結(jié)果,分析可能影響群落多樣性的因素.
7.從2021年秋季學(xué)期起,黑龍江省啟動(dòng)實(shí)施高考綜合改革,實(shí)行高考科目“3+1+2”模式.“3”指語(yǔ)文、數(shù)學(xué)、外語(yǔ)三門(mén)統(tǒng)考學(xué)科,以原始分?jǐn)?shù)計(jì)入高考成績(jī);“1”指考生從物理、歷史兩門(mén)學(xué)科中“首選”一門(mén)學(xué)科,以原始分?jǐn)?shù)計(jì)入高考成績(jī);“2”指考生從政治、地理、化學(xué)、生物四門(mén)學(xué)科中“再選”兩門(mén)學(xué)科,以等級(jí)分計(jì)入高考成績(jī).按照方案,再選學(xué)科的等級(jí)分賦分規(guī)則如下,將考生原始成績(jī)從高到低劃分為A,B,C,D,E五個(gè)等級(jí),各等級(jí)人數(shù)所占比例及賦分區(qū)間如下表:
等級(jí) A B C D E
人數(shù)比例
賦分區(qū)間
將各等級(jí)內(nèi)考生的原始分依照等比例轉(zhuǎn)換法分別轉(zhuǎn)換到賦分區(qū)間內(nèi),得到等級(jí)分,轉(zhuǎn)換公式為,其中分別表示原始分區(qū)間的最低分和最高分,分別表示等級(jí)賦分區(qū)間的最低分和最高分,表示考生的原始分,表示考生的等級(jí)分,規(guī)定原始分為時(shí),等級(jí)分為.某次化學(xué)考試的原始分最低分為50,最高分為98,呈連續(xù)整數(shù)分布,其頻率分布直方圖如下:
(1)根據(jù)頻率分布直方圖,求,并估計(jì)此次化學(xué)考試原始分的平均值;
(2)按照等級(jí)分賦分規(guī)則,估計(jì)此次考試化學(xué)成績(jī)A等級(jí)的原始分區(qū)間;
(3)用估計(jì)的結(jié)果近似代替原始分區(qū)間,若某學(xué)生化學(xué)成績(jī)的原始分為88,試計(jì)算其等級(jí)分(計(jì)算結(jié)果四舍五入取整).
8.(2024·全國(guó)·模擬預(yù)測(cè))某校20名學(xué)生的數(shù)學(xué)成績(jī)和知識(shí)競(jìng)賽成績(jī)?nèi)缦卤恚?br/>學(xué)生編號(hào) 1 2 3 4 5 6 7 8 9 10
數(shù)學(xué)成績(jī) 100 99 96 93 90 88 85 83 80 77
知識(shí)競(jìng)賽成績(jī) 290 160 220 200 65 70 90 100 60 270
學(xué)生編號(hào) 11 12 13 14 15 16 17 18 19 20
數(shù)學(xué)成績(jī) 75 74 72 70 68 66 60 50 39 35
知識(shí)競(jìng)賽成績(jī) 45 35 40 50 25 30 20 15 10 5
計(jì)算可得數(shù)學(xué)成績(jī)的平均值是,知識(shí)競(jìng)賽成績(jī)的平均值是,并且,,.
(1)求這組學(xué)生的數(shù)學(xué)成績(jī)和知識(shí)競(jìng)賽成績(jī)的樣本相關(guān)系數(shù)(精確到).
(2)設(shè),變量和變量的一組樣本數(shù)據(jù)為,其中兩兩不相同,兩兩不相同.記在中的排名是第位,在中的排名是第位,.定義變量和變量的“斯皮爾曼相關(guān)系數(shù)”(記為)為變量的排名和變量的排名的樣本相關(guān)系數(shù).
(i)記,.證明:.
(ii)用(i)的公式求這組學(xué)生的數(shù)學(xué)成績(jī)和知識(shí)競(jìng)賽成績(jī)的“斯皮爾曼相關(guān)系數(shù)”(精確到).
(3)比較(1)和(2)(ii)的計(jì)算結(jié)果,簡(jiǎn)述“斯皮爾曼相關(guān)系數(shù)”在分析線性相關(guān)性時(shí)的優(yōu)勢(shì).
注:參考公式與參考數(shù)據(jù).;;.
9.某種人臉識(shí)別方法,采用了視頻分塊聚類(lèi)的自動(dòng)識(shí)別系統(tǒng).規(guī)定:某區(qū)域內(nèi)的個(gè)點(diǎn)的深度的均值為,標(biāo)準(zhǔn)差為,深度的點(diǎn)視為孤立點(diǎn).下表給出某區(qū)域內(nèi)8個(gè)點(diǎn)的數(shù)據(jù):
15.1 15.2 15.3 15.4 15.5 15.4 15.4 13.8
15.1 14.2 14.3 14.4 14.5 15.4 14.4 15.4
20 12 13 15 16 14 12 18
(1)根據(jù)以上數(shù)據(jù),計(jì)算的值;
(2)判斷表中各點(diǎn)是否為孤立點(diǎn).
10.(2024·江西吉安·一模)黨的二十大報(bào)告提出,要推進(jìn)健康中國(guó)建設(shè),把保障人民健康放在優(yōu)先發(fā)展的戰(zhàn)略位置,完善人民健康促進(jìn)政策.《國(guó)務(wù)院關(guān)于印發(fā)全民健身計(jì)劃(—年)的通知》中指出,深入實(shí)施健康中國(guó)戰(zhàn)略和全民健身國(guó)家戰(zhàn)略,加快體育強(qiáng)國(guó)建設(shè),構(gòu)建更高水平的全民健身公共服務(wù)體系,充分發(fā)揮全民健身在提高人民健康水平 促進(jìn)人的全面發(fā)展 推動(dòng)經(jīng)濟(jì)社會(huì)發(fā)展 展示國(guó)家文化軟實(shí)力等方面的綜合價(jià)值與多元功能.如圖為年~年(年的年份序號(hào)為)我國(guó)健身人數(shù)(百萬(wàn)人)變化情況的折線圖:
統(tǒng)計(jì)學(xué)中的樣本點(diǎn)具有二重性,樣本是可以觀測(cè)的隨機(jī)變量,本題將和視為兩個(gè)隨機(jī)變量且以上數(shù)據(jù)圖中的每個(gè)樣本點(diǎn)的產(chǎn)生的概率都是,已知,其中表示的平均數(shù).
參考數(shù)據(jù)及公式:.和兩個(gè)隨機(jī)變量之間的皮爾遜相關(guān)系數(shù)為,線性回歸方程中,.
(1)求回歸方程的皮爾遜相關(guān)系數(shù)(保留位有效數(shù)字);
(2)求關(guān)于的回歸方程.
11.(2024·湖南郴州·三模)chatGPT是由OpenAI開(kāi)發(fā)的一款人工智能機(jī)器人程序,一經(jīng)推出就火遍全球.chatGPT的開(kāi)發(fā)主要采用RLHF(人類(lèi)反饋強(qiáng)化學(xué)習(xí))技術(shù),訓(xùn)練分為以下三個(gè)階段.
第一階段:訓(xùn)練監(jiān)督策略模型.對(duì)抽取的prompt數(shù)據(jù),人工進(jìn)行高質(zhì)量的回答,獲取數(shù)據(jù)對(duì),幫助數(shù)學(xué)模型GPT-3.5更好地理解指令.
第二階段:訓(xùn)練獎(jiǎng)勵(lì)模型.用上一階段訓(xùn)練好的數(shù)學(xué)模型,生成個(gè)不同的回答,人工標(biāo)注排名,通過(guò)獎(jiǎng)勵(lì)模型給出不同的數(shù)值,獎(jiǎng)勵(lì)數(shù)值越高越好.獎(jiǎng)勵(lì)數(shù)值可以通過(guò)最小化下面的交叉熵?fù)p失函數(shù)得到:,其中,且.
第三階段:實(shí)驗(yàn)與強(qiáng)化模型和算法.通過(guò)調(diào)整模型的參數(shù),使模型得到最大的獎(jiǎng)勵(lì)以符合人工的選擇取向.
參考數(shù)據(jù):
(1)若已知某單個(gè)樣本,其真實(shí)分布,其預(yù)測(cè)近似分布,計(jì)算該單個(gè)樣本的交叉熵?fù)p失函數(shù)Loss值.
(2)絕對(duì)值誤差MAE也是一種比較常見(jiàn)的損失函數(shù),現(xiàn)已知某階變量的絕對(duì)值誤差,,其中,表示變量的階.若已知某個(gè)樣本是一個(gè)三階變量的數(shù)陣,其真實(shí)分布是,現(xiàn)已知其預(yù)測(cè)分布為,求證:該變量的絕對(duì)值誤差為定值.
(3)在測(cè)試chatGPT時(shí),如果輸入問(wèn)題沒(méi)有語(yǔ)法錯(cuò)誤chatGPT的回答被采納的概率為,當(dāng)出現(xiàn)語(yǔ)法錯(cuò)誤時(shí),chatGPT的回答被采納的概率為.現(xiàn)已知輸入的問(wèn)題中出現(xiàn)語(yǔ)法錯(cuò)誤的概率為,現(xiàn)已知chatGPT的回答被采納,求該問(wèn)題的輸入語(yǔ)法沒(méi)有錯(cuò)誤的概率.
12.某抽獎(jiǎng)系統(tǒng)中,抽得的物品可分為星,星和星,其中一種抽獎(jiǎng)種類(lèi)中的抽獎(jiǎng)系統(tǒng)的概率和相關(guān)保底機(jī)制如下:
物品類(lèi)別 星 星 星
基礎(chǔ)概率
基礎(chǔ)概率:在沒(méi)有任何其他機(jī)制的影響下,單次抽獎(jiǎng)抽中指定類(lèi)別獎(jiǎng)品的概率.
保底機(jī)制:現(xiàn)假定玩家從未進(jìn)行過(guò)抽獎(jiǎng),則玩家抽取星(或星)的概率會(huì)隨者未抽中星(或星)的次數(shù)增加而改變,相關(guān)機(jī)制如下表所示:
連續(xù)未抽中星的次數(shù)
下一次抽中星的概率
連續(xù)未抽中星的次數(shù)
(1)根據(jù)題中數(shù)據(jù),估計(jì)這240名學(xué)生中第5題的實(shí)測(cè)答對(duì)人數(shù);
(2)定義統(tǒng)計(jì)量,其中為第i題的實(shí)測(cè)難度,為第i題的預(yù)估難度(i=1,2,…,n).規(guī)定:若,則稱(chēng)該次測(cè)試的難度預(yù)估合理,否則為不合理.試據(jù)此判斷本次測(cè)試的難度預(yù)估是否合理.
14.某校在學(xué)年期末舉行“我最喜歡的文化課”評(píng)選活動(dòng),投票規(guī)則是一人一票,高一(1)班44名學(xué)生和高一(7)班45名學(xué)生的投票結(jié)果如表(無(wú)廢票):
語(yǔ)文 數(shù)學(xué) 外語(yǔ) 物理 化學(xué) 生物 政治 歷史 地理
高一(1)班 6 9 7 5 4 5 3 3 2
高一(7)班 a 7 b 4 5 6 5 2 3
該校把上表的數(shù)據(jù)作為樣本,把兩個(gè)班同一學(xué)科的得票之和定義為該年級(jí)該學(xué)科的“好感指數(shù)”.
(1)如果數(shù)學(xué)學(xué)科的“好感指數(shù)”比高一年級(jí)其他文化課都高,求的所有取值;
(2)從高一(1)班投票給政治 歷史 地理的學(xué)生中任意選取3位同學(xué),設(shè)隨機(jī)變量X為投票給地理學(xué)科的人數(shù),求X的分布列和期望;
(3)當(dāng)a為何值時(shí),高一年級(jí)的語(yǔ)文 數(shù)學(xué) 外語(yǔ)三科的“好感指數(shù)”的方差最小?(結(jié)論不要求證明)
15.下表是中國(guó)近年來(lái)人口數(shù)據(jù)(不包括香港、澳門(mén)特別行政區(qū)和臺(tái)灣省):
年份 2013 2014 2015 2016
人口數(shù) 13.61億 13.68億 13.75億 13.83億
(1)在平面直角坐標(biāo)系內(nèi)標(biāo)出這四個(gè)點(diǎn),再把這些點(diǎn)連接成線;
(2)選擇其中合適的兩個(gè)點(diǎn),建立一次函數(shù)模擬,用模擬函數(shù)預(yù)測(cè)2017年中國(guó)人口數(shù);
(3)能否用“更好”的直線來(lái)模擬這組數(shù)據(jù)的變化?也就是說(shuō),能否確定,的值,使式子的值最小?(按如下步驟進(jìn)行預(yù)測(cè))
①化簡(jiǎn)S,使之成為字母的二次三項(xiàng)式;
②當(dāng)取何值時(shí)(設(shè)為),二次三項(xiàng)式S取最小值(設(shè)為),這里和都應(yīng)該是含字母的式子,且是字母的二次三項(xiàng)式;
③求的值,使取最小值;
④求出對(duì)應(yīng)于上述的值;
⑤用一次函數(shù)模擬數(shù)據(jù)的變化,用模擬函數(shù)預(yù)測(cè)2017年中國(guó)人口數(shù).
(4)把所得到的兩個(gè)預(yù)測(cè)數(shù)據(jù)和2017年中國(guó)實(shí)際人口數(shù)進(jìn)行比較.
16.(2024·北京西城·一模)在測(cè)試中,客觀題難度的計(jì)算公式為,其中為第題的難度,為答對(duì)該題的人數(shù),為參加測(cè)試的總?cè)藬?shù)現(xiàn)對(duì)某校高三年級(jí)240名學(xué)生進(jìn)行一次測(cè)試,共5道客觀題測(cè)試前根據(jù)對(duì)學(xué)生的了解,預(yù)估了每道題的難度,如表所示:
題號(hào) 1 2 3 4 5
考前預(yù)估難度
測(cè)試后,隨機(jī)抽取了20名學(xué)生的答題數(shù)據(jù)進(jìn)行統(tǒng)計(jì),結(jié)果如下:
題號(hào) 1 2 3 4 5
實(shí)測(cè)答對(duì)人數(shù) 16 16 14 14 4
(1)根據(jù)題中數(shù)據(jù),估計(jì)這240名學(xué)生中第5題的實(shí)測(cè)答對(duì)人數(shù);
(2)從抽樣的20名學(xué)生中隨機(jī)抽取2名學(xué)生,記這2名學(xué)生中第5題答對(duì)的人數(shù)為,求的分布列和數(shù)學(xué)期望;
(3)試題的預(yù)估難度和實(shí)測(cè)難度之間會(huì)有偏差設(shè)為第題的實(shí)測(cè)難度,請(qǐng)用和設(shè)計(jì)一個(gè)統(tǒng)計(jì)量,并制定一個(gè)標(biāo)準(zhǔn)來(lái)判斷本次測(cè)試對(duì)難度的預(yù)估是否合理.
21世紀(jì)教育網(wǎng)(www.21cnjy.com)

展開(kāi)更多......

收起↑

資源列表

<pre id="tfb94"><li id="tfb94"></li></pre>

<bdo id="tfb94"><rt id="tfb94"></rt></bdo>
  • <menu id="tfb94"><dl id="tfb94"></dl></menu><i id="tfb94"><acronym id="tfb94"><sub id="tfb94"></sub></acronym></i>

    1. 主站蜘蛛池模板: 巴楚县| 漯河市| 太谷县| 绵竹市| 齐齐哈尔市| 阿荣旗| 剑河县| 黎平县| 襄樊市| 东山县| 二手房| 东乌| 上犹县| 塘沽区| 许昌县| 教育| 扶余县| 花垣县| 合江县| 宝清县| 重庆市| 伊金霍洛旗| 雅江县| 卓尼县| 灵石县| 衢州市| 綦江县| 新龙县| 民县| 长治市| 英吉沙县| 水城县| 光泽县| 页游| 庆阳市| 宣城市| 定远县| 彭州市| 盐津县| 邵阳县| 夹江县|