資源簡(jiǎn)介 課題名稱 第3課 用機(jī)器學(xué)習(xí)解決問(wèn)題課時(shí)目標(biāo) 1.能夠熟練完成從問(wèn)題分析到數(shù)據(jù)收集、整理,再到模型訓(xùn)練、評(píng)估和應(yīng)用的全過(guò)程。 2.學(xué)會(huì)根據(jù)不同問(wèn)題特點(diǎn)選擇合適的方法,熟練使用數(shù)據(jù)處理工具對(duì)數(shù)據(jù)清洗、整理和劃分。 3.能依據(jù)具體問(wèn)題,準(zhǔn)確選擇合適的機(jī)器學(xué)習(xí)算法,使用BaseML工具進(jìn)行模型訓(xùn)練與優(yōu)化。 4.能將訓(xùn)練好的模型與其他編程語(yǔ)言結(jié)合,開(kāi)發(fā)出簡(jiǎn)單的AI應(yīng)用,提升解決實(shí)際問(wèn)題的能力。教學(xué)準(zhǔn)備 計(jì)算機(jī)、XEdu工具、相關(guān)數(shù)據(jù)集、教學(xué)課件導(dǎo)學(xué)過(guò)程 意圖說(shuō)明知識(shí)探究 1.項(xiàng)目子任務(wù)引入 ——明確指出,本節(jié)課將深入學(xué)習(xí)如何利用機(jī)器學(xué)習(xí)技術(shù)解決真實(shí)問(wèn)題,這是前面所學(xué)知識(shí)應(yīng)用于實(shí)際的關(guān)鍵環(huán)節(jié),也是完成項(xiàng)目任務(wù)的核心步驟,引導(dǎo)學(xué)生積極投入學(xué)習(xí)。 2.探究?jī)?nèi)容與要求 方法引導(dǎo):采用案例驅(qū)動(dòng)和實(shí)踐操作相結(jié)合的方法,通過(guò)具體案例詳細(xì)剖析每個(gè)環(huán)節(jié)的 操作要點(diǎn)和注意事項(xiàng),讓學(xué)生在實(shí)踐中掌握用機(jī)器學(xué)習(xí)解決問(wèn)題的方法。 (2)主要內(nèi)容: ①哪些問(wèn)題適合用機(jī)器學(xué)習(xí)解決?——問(wèn)題分析與數(shù)據(jù)準(zhǔn)備 ②模型訓(xùn)練的關(guān)鍵要點(diǎn)有哪些?——模型訓(xùn)練和評(píng)估、優(yōu)化 ③模型應(yīng)用的常見(jiàn)方式有哪些?——模型應(yīng)用 3.知識(shí)習(xí)得 (1)自主閱讀:引導(dǎo)學(xué)生以教材相關(guān)章節(jié)和 XEdu工具的官方文檔為主,網(wǎng)絡(luò)資料作補(bǔ)充,自主閱讀學(xué)習(xí)如何用機(jī)器學(xué)習(xí)解決問(wèn)題的相關(guān)知識(shí)。在學(xué)生閱讀過(guò)程中,教師巡視并解答疑問(wèn),引導(dǎo)學(xué)生關(guān)注重點(diǎn)內(nèi)容和關(guān)鍵操作步驟。 (2)知識(shí)梳理:通過(guò)提問(wèn)、總結(jié)、填寫(xiě)表格等方式,幫助學(xué)生梳理知識(shí)要點(diǎn)。例如,設(shè)計(jì)如下表格讓學(xué)生填寫(xiě): 學(xué)習(xí)內(nèi)容具體要點(diǎn)問(wèn)題分析方法判斷問(wèn)題是否適合機(jī)器學(xué)習(xí)的依據(jù): 1. 問(wèn)題是否存在規(guī)律,如變量之間是否有潛在關(guān)聯(lián)。 2. 能否獲取相關(guān)的數(shù)據(jù),數(shù)據(jù)的可收集性是關(guān)鍵。 3. 問(wèn)題的復(fù)雜程度,簡(jiǎn)單的線性問(wèn)題更適合基礎(chǔ)算法,復(fù)雜問(wèn)題可能需要更高級(jí)的算法。數(shù)據(jù)收集方法“身高推斷” 適用方法:1. 在線調(diào)查:設(shè)計(jì)問(wèn)卷收集身高、腳長(zhǎng)、體重等相關(guān)信息。2. 直接測(cè)量:對(duì)身邊人群進(jìn)行實(shí)地測(cè)量獲取數(shù)據(jù)。“預(yù)測(cè)商品銷(xiāo)量” 適用方法:1. 企業(yè)內(nèi)部銷(xiāo)售記錄收集:獲取本企業(yè)商品的歷史銷(xiāo)售數(shù)據(jù)。2. 網(wǎng)絡(luò)數(shù)據(jù)抓取:利用爬蟲(chóng)技術(shù)收集電商平臺(tái)上同類商品的銷(xiāo)售數(shù)據(jù)、價(jià)格等信息。數(shù)據(jù)整理操作數(shù)據(jù)整理的目的:1. 保證數(shù)據(jù)完整性:識(shí)別和處理數(shù)據(jù)集中的缺失值。2. 確保數(shù)據(jù)統(tǒng)一性:所有數(shù)據(jù)遵循相同的格式和標(biāo)準(zhǔn)。3. 提高數(shù)據(jù)準(zhǔn)確性:識(shí)別和校正數(shù)據(jù)中的錯(cuò)誤或不合理的值。“身高推斷” 數(shù)據(jù)整理具體操作:1. 檢查體重、鞋碼等數(shù)據(jù),去除異常值(如體重過(guò)輕或過(guò)重、鞋碼不符合常理的數(shù)據(jù))。2. 填補(bǔ)缺失的身高或其他特征數(shù)據(jù),可采用均值、中位數(shù)等方法。3. 統(tǒng)一數(shù)據(jù)單位,如將身高的單位統(tǒng)一為厘米。數(shù)據(jù)集劃分工具BaseDT 工具函數(shù):split_tab_dataset ()函數(shù)參數(shù)含義:1. path:指定待拆分的 CSV 數(shù)據(jù)集路徑。2. data_column:用于指定特征數(shù)據(jù)列,以范圍或具體列號(hào)表示。3. label_column:指定標(biāo)簽列,即預(yù)測(cè)目標(biāo)所在列。4. train_val_ratio:設(shè)定訓(xùn)練集和驗(yàn)證集的拆分比例。模型訓(xùn)練要點(diǎn)高質(zhì)量數(shù)據(jù)集的要求:1. 盡量避免錯(cuò)誤:錯(cuò)誤數(shù)據(jù)會(huì)嚴(yán)重影響模型訓(xùn)練效果。2. 數(shù)據(jù)量要大:數(shù)據(jù)量過(guò)少難以訓(xùn)練出準(zhǔn)確的模型。3. 數(shù)據(jù)要盡可能擴(kuò)大覆蓋面:如預(yù)測(cè)身高不能僅用某一年齡段或某一地區(qū)的數(shù)據(jù)。選擇算法考慮因素:1. 任務(wù)類型:回歸任務(wù)還是分類任務(wù)。2. 數(shù)據(jù)特點(diǎn):如數(shù)據(jù)的線性關(guān)系、數(shù)據(jù)維度、數(shù)據(jù)量大小等。3. 算法的復(fù)雜度和可解釋性:復(fù)雜算法可能精度高但難以解釋,簡(jiǎn)單算法則相反。模型評(píng)估指標(biāo)常用評(píng)估指標(biāo):1. 值(決定系數(shù))2. 均方誤差(MSE)指標(biāo)含義:1. 值:取值在 0 和 1 之間,越接近 1 說(shuō)明模型對(duì)數(shù)據(jù)的擬合效果越好,模型與實(shí)際數(shù)據(jù)的相關(guān)性越高;越接近 0 說(shuō)明模型效果越差,與實(shí)際數(shù)據(jù)相關(guān)性低。2. 均方誤差:衡量預(yù)測(cè)值與真實(shí)值之間的平均誤差平方,值越小,說(shuō)明模型預(yù)測(cè)結(jié)果越接近真實(shí)值,模型的預(yù)測(cè)精度越高。核心素養(yǎng)培育 (1)學(xué)會(huì)分析:給出一些實(shí)際問(wèn)題,如預(yù)測(cè)學(xué)生的考試成績(jī)提升情況、分析客戶的購(gòu)買(mǎi)偏好等,讓學(xué)生分析這些問(wèn)題是否適合用機(jī)器學(xué)習(xí)解決,以及如何進(jìn)行數(shù)據(jù)準(zhǔn)備、選擇合適的算法和評(píng)估模型。引導(dǎo)學(xué)生從問(wèn)題的性質(zhì)、數(shù)據(jù)的可獲取性、算法的適用性等方面進(jìn)行分析,培養(yǎng)學(xué)生分析問(wèn)題的能力。 (2)學(xué)會(huì)探究:探究如何訓(xùn)練回歸模型推斷人體身高并搭建一個(gè)身高推斷系統(tǒng)。 ①?gòu)?fù)制“身高推斷系統(tǒng)”文件夾到XEDU教學(xué)資源目錄下,使用Jupyter打開(kāi)3.訓(xùn)練回歸模型推斷人體身高并搭建一個(gè)身高推斷系.ipynb文件; ②讀取數(shù)據(jù)并查看,拆分訓(xùn)練集、測(cè)試集,選擇不同的算法進(jìn)行模型訓(xùn)練和評(píng)估; ③使用不同的特征列進(jìn)行模型訓(xùn)練的優(yōu)化,優(yōu)化完成后編寫(xiě)模型應(yīng)用程序。 (3)對(duì)學(xué)科方法、工具或作品進(jìn)行評(píng)價(jià)反思 組織學(xué)生討論在使用機(jī)器學(xué)習(xí)解決問(wèn)題的過(guò)程中,所運(yùn)用的方法(如數(shù)據(jù)收集、模型訓(xùn)練、評(píng)估和優(yōu)化的方法)有哪些優(yōu)點(diǎn)和不足 二、習(xí)題測(cè)試 選擇題: 在機(jī)器學(xué)習(xí)中,數(shù)據(jù)整理不包括以下哪項(xiàng)操作( ) A. 數(shù)據(jù)清洗 B. 數(shù)據(jù)標(biāo)注 C. 數(shù)據(jù)擴(kuò)充 D. 數(shù)據(jù)劃分 填空題:使用 BaseDT 工具劃分?jǐn)?shù)據(jù)集時(shí),函數(shù)“split_tab_dataset ()”中用于指定拆分比例的參數(shù)是__________。 簡(jiǎn)答題:簡(jiǎn)述在選擇機(jī)器學(xué)習(xí)算法時(shí)需要考慮的因素。 三、小結(jié)回顧 請(qǐng)同學(xué)按照下列提示進(jìn)行總結(jié)回顧: 1.學(xué)到了哪些知識(shí)與技能? 2.提升了哪些方面的能力? 3.生成了怎樣的觀點(diǎn)? 四、布置作業(yè) 1.項(xiàng)目實(shí)施作業(yè) 請(qǐng)各小組對(duì)項(xiàng)目探究的階段成果進(jìn)行整理并提交,整理內(nèi)容: 項(xiàng)目報(bào)告 報(bào)告內(nèi)容包括問(wèn)題分析過(guò)程、數(shù)據(jù)處理步驟、模型訓(xùn)練結(jié)果(包括選擇的算法、評(píng)估指標(biāo)等)、模型應(yīng)用的方式(如設(shè)計(jì)的智能系統(tǒng)界面或使用說(shuō)明)以及遇到的問(wèn)題和解決方法 2.課后挑戰(zhàn)作業(yè) 選擇一個(gè)新的實(shí)際問(wèn)題,如預(yù)測(cè)某地區(qū)的空氣質(zhì)量指數(shù)、分析股票價(jià)格走勢(shì)等,嘗試使用機(jī)器學(xué)習(xí)方法解決該問(wèn)題。要求學(xué)生記錄整個(gè)過(guò)程,包括問(wèn)題分析、數(shù)據(jù)收集和處理、模型選擇和訓(xùn)練、評(píng)估和優(yōu)化以及模型應(yīng)用的思路和嘗試,形成書(shū)面報(bào)告。在報(bào)告中,要分析所選擇的方法和工具是否合適,以及還可以從哪些方面進(jìn)一步改進(jìn)和完善。 展開(kāi)更多...... 收起↑ 資源預(yù)覽 縮略圖、資源來(lái)源于二一教育資源庫(kù)