資源簡介 (共28張PPT)機器學(xué)習(xí)算法類型:監(jiān)督學(xué)習(xí)——K 近 鄰 算 法 蘋 果 檸 檬 分 類機器學(xué)習(xí)算法類型:機器學(xué)習(xí)算法類型監(jiān)督學(xué)習(xí)K近鄰算法決策樹線性回歸樸素貝葉斯無監(jiān)督學(xué)習(xí)聚類算法主題模型推薦系統(tǒng)思考:如何來區(qū)分蘋果和檸檬?顏色大小形狀表皮特 征蘋果和檸檬都有那些外部特征?標(biāo)簽 長 寬蘋果 7.0 7.1標(biāo)簽 長 寬檸檬 6.0 8.2長寬長寬采集蘋果和檸檬長寬特征:標(biāo)簽 長 寬檸檬 7.23 5.51檸檬 6.69 5.97檸檬 6.63 5.56檸檬 5.67 5.82檸檬 6.37 4.68檸檬 5.59 5.75檸檬 6.58 4.43檸檬 5.44 5.92檸檬 5.11 4.37檸檬 5.07 4.21蘋果 8.41 7.00蘋果 8.11 7.30蘋果 8.79 6.12蘋果 8.07 7.55蘋果 8.93 7.24蘋果 8.73 7.60蘋果 9.47 6.15蘋果 9.50 6.18蘋果 9.72 6.17蘋果 9.32 7.79任務(wù)一:將 數(shù) 據(jù) 處 理 成 散 點 圖。探究活動——數(shù)據(jù)可視化請同學(xué)們打開實踐活動表格,跟老師一起完成散點圖描繪任務(wù)。探究活動——發(fā)現(xiàn)數(shù)據(jù)特征探究分類算法檸檬蘋果長寬探究活動——發(fā)現(xiàn)數(shù)據(jù)特征探究分類算法長檸檬蘋果寬CABA 為蘋果B C為檸檬問 題分別預(yù)測A、B、C三個點屬于什么水果,為什么?探究活動——發(fā)現(xiàn)數(shù)據(jù)特征探究分類算法檸檬蘋果長寬CAB方法一:同區(qū)域范圍屬于同一類“物以類聚”探究活動——發(fā)現(xiàn)數(shù)據(jù)特征探究分類算法檸檬蘋果長寬探究活動——發(fā)現(xiàn)數(shù)據(jù)特征探究分類算法長檸檬蘋果寬aa直線:直線上方是蘋果直線下方是檸檬探究活動——發(fā)現(xiàn)數(shù)據(jù)特征探究分類算法長檸檬蘋果寬a1a2a3an-1an問題:下列哪條直線分類更合理?請同學(xué)思考并回答。a1長寬b1c1檸檬蘋果探究活動——發(fā)現(xiàn)數(shù)據(jù)特征探究分類算法問題:下列哪條直線分類更合理?b1長寬a1c1AB檸檬蘋果探究活動——發(fā)現(xiàn)數(shù)據(jù)特征探究分類算法長寬b2a2c2檸檬蘋果探究活動——發(fā)現(xiàn)數(shù)據(jù)特征探究分類算法問題:下列哪條直線分類更合理?請同學(xué)思考并回答。看這張圖:A2 ,B2,C2 3條直線中,哪一條直線分類更合理?請同學(xué)們思考。長寬a2b2c2檸檬蘋果AB問題:下列哪條直線分類更合理?探究活動——發(fā)現(xiàn)數(shù)據(jù)特征探究分類算法長寬a3b3c3檸檬蘋果探究活動——發(fā)現(xiàn)數(shù)據(jù)特征探究分類算法從剛才和學(xué)生一起的探究過程中,我們會發(fā)現(xiàn):C3分類更合理,分類更合理的這條直線都有哪些特征?檸檬蘋果長寬a4b4c4ABββ分類間隔2β最優(yōu)分類直線具備兩個特征:1.它夾在兩類樣本之間。2.對樣本中最近兩個點A、B分類間隔β最大,分類間隔和2β最大。用直線將兩類水果分開,這屬于分類算法中的支持向量機算法。方法二:劃直線區(qū)分兩個區(qū)域探究活動——發(fā)現(xiàn)數(shù)據(jù)特征探究分類算法分類最合理的直線,它有這兩個特征,首先這條直線夾在兩個樣本之間。并且兩類樣本中最近的兩個點A點和B點。他們的分類間隔最大。用直線將兩類水果分開,這屬于分類算法中的支持向量積算法CAB問題:分別預(yù)測A、B、C三個未知水果屬于什么水果,為什么?檸檬蘋果長寬A 蘋果B 檸檬離誰近就屬于哪一類探究活動——發(fā)現(xiàn)數(shù)據(jù)特征探究分類算法取預(yù)測對象最近的K個點,哪個類別的點占比多,它就屬于哪一類。概括為:“觀其鄰,而識其類”。離C最近的3個鄰居中,有2個是蘋果,有1個是檸檬,所以C可能是蘋果。離C最近的1個鄰居中,是檸檬,所以C可能是檸檬。檸 檬蘋果寬CAB長K 近 鄰 算 法方法三:離誰近就屬于哪一類探究活動——發(fā)現(xiàn)數(shù)據(jù)特征探究分類算法實踐活動:利用電子表格探究K近鄰算法第一步:計算距離,利用歐式距離公式計算未知水果到各個樣本之間的距離。第二步:給距離排序。第三步:選取K值。第四步:投票分類,找到K個“最近鄰居”類別占比情況,確定未知水果的種類。拓展實踐:利用電子表格探究K近鄰算法利用電子表格實現(xiàn)K近鄰算法對蘋果和檸檬的預(yù)測。拓展實踐:利用電子表格探究K近鄰算法小說分類男女生判斷朋友選擇糖尿病診斷拓展實踐:利用電子表格探究K近鄰算法小說分類男女生判斷朋友選擇兩種數(shù)據(jù)特征(二維)三種數(shù)據(jù)特征(三維)多分類K近鄰算法不僅能解決二維特征分類,也能解決多維特征分類。也解決多分類問題。拓展實踐:利用電子表格探究K近鄰算法數(shù)據(jù)特征多樣本多計算復(fù)雜課后探索嘗試將本節(jié)課的實踐任務(wù)用編程的方式呈現(xiàn),并且對未知樣本進行預(yù)測。課堂總結(jié):機器學(xué)習(xí)算法類型:監(jiān)督學(xué)習(xí)訓(xùn)練數(shù)據(jù):蘋果檸檬長寬特征探究分類算法(K近鄰算法)利用K近鄰算法構(gòu)建分類器未知樣本預(yù)測結(jié)果 展開更多...... 收起↑ 資源預(yù)覽 縮略圖、資源來源于二一教育資源庫