資源簡介 教學設計課程基本信息學科 信息技術 年級 高一 學期 春季課題 5.3數據的分析 5.3.1特征探索教科書 書 名:信息技術 數據與計算 必修1 教材 出版社:廣東教育出版社教學目標理解特征探索(數據預處理)的作用和常用方法。 掌握選用恰當的工具處理數據,可視化表達數據,揭示數據反映的本質問題。 體驗多種數據分析技術,激發學生的學習熱情,培養學生的編程興趣。教學重難點教學重點: 理解數據預處理(特征探索)技術,能夠通過程序簡單實踐數據的特征探索處理。 教學難點: 能夠根據具體數據分析的需要,選用恰當的工具處理數據,并獲取一定結論。教學過程情境導入 1、展示利用爬蟲程序爬取的淘寶零食的部分數據,其中主要包括價格與評論。 2、提出問題: 在市場競爭中,通過現有的數據,企業應該如何輕松并且準確得來探索他的特征,分析出對自己有價值的信息呢? 進一步給出數據分析的概念: 數據分析是通過運用數字化工具和技術,對大批量雜亂無章的數據進行探索和分析,從中發現數據內在的結構和規律,并構建數學模型進行可視化表達。通過驗證這些模型,我們可以將其轉化為知識,以便更好地了解事物的現狀、剖析事物的發展趨勢,并預測事物的未來走向。 舉例說明: 導入本節課主題:數據分析之數據特征探索,即對淘寶零食的部分數據預處理,并挖掘數據價值。 探究新知 特征探索的概念和作用 1.1教師:我們可以從哪些方面來對淘寶零食數據進行預處理? 發現和處理缺失值、異常數據 繪制散點圖,直方圖 觀察分析數據的分布特征 求最大值、最小值、極差等描述性統計量。 極差:極差是最大值和最小值之間的差異或范圍。它計算了數據集的全局范圍。極差量化了數據的變異程度,提供了數據在整個取值范圍內的大小差別。 他們能夠很直觀地描述數據的總體特征,取值范圍,分布范圍,集中度,大小排序,方便繪圖,直觀反映數據情況,獲得更全面的數據分析和解釋。 以上,對數據的預處理方式都屬于數據的特征探索。通常情況,對于未知的數據先進行特征探索。 1.2教師:在對數據的完成預處理處理以后,如何來挖掘數據價值? 論證該使用何種統計推斷進行分析 通過可視化對數據構建初始認知 對于數據集中的某些現象原因提出假設,分析 對進一步的數據收集及調查做基礎 1.3過程:我們可以找到淘寶零食數據中的缺失部分,異常部分。 求最大值、最小值、極差 繪制散點圖,直方圖 在最后回答本節課問題: 通過分析直方圖,企業能夠得到什么有用的信息呢? 2、教師:數據庫的建立 在進行數據分析前,通常需要建立一個數據庫。通過建立數據庫,存儲大量數據,方便后續的數據分析和處理工作。 創建數據庫csdn和數據表taob,并導入文件taob.sql中的數據。 (如果有不熟悉如何創建數據庫的同學,可以參考配套資料) 3、引導學生開展探究活動 逐個完成“程序5-5-1 數據預處理(教材范例).py”,體驗數據預處理過程。 3.1數據清洗,發現缺失值,并打印缺失值的個數。 3.2異常處理,利用畫散點圖,發現異常值部分。 3.3設置篩選條件,重新繪制散點圖。 3.4求最大值、最小值、極差等描述性統計量。 3.5繪制價格直方圖,可以讓我們直觀的看到商品在不同價格區間的分布數量。 3.6繪制評論數直方圖,可以讓我們看到不同評論數的商品數量。 4.展示結果。 教師:思考從直方圖中,哪些價格區間的商品評論數較低,可能表現不佳,用戶體驗和滿意度較低,可以進行提高改進? 4.1價格更高的商品,大家的評論的積極性會更強。 4.2消費者認為價格20-40元的商品價值較低,從而不愿意購買或分享購買體驗。 4.3同時價格20-40元的商品可能意味著有潛在的商機和市場空白。如果這些商品能夠提高它們的質量和知名度,吸引更多消費者的關注和評論,那么它們可能有機會在競爭激烈的市場中脫穎而出。 總結 通過本節課特征探索的學習,學生了解到了對于未知的數據,我們先進行特征探索,以便對數據有初步的認識,以及數據分析下的特征探索的基本流程和操作方法。 在進行數據分析之前,通常需要建立一個數據庫來存儲數據,然后再進行數據的預處理,包括處理缺失值和異常數據,以及繪制直方圖和計算描述性統計量等工作。 特征探索為后續的數據分析提供支持,選擇合適的統計工具和技術進行數據分析處理,還可以為后續的數據收集和調查提供基礎,幫助我們確定進一步的數據需求和采集方向。這些技能對于日常生活中的數據分析和決策都具有重要意義。 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫