資源簡介 (共23張PPT)數據的分析(特征探索)知識回顧數據采集數據存儲數據分析可視化表達導入某零食運營企業,需要調整運營策略。他們獲取了近一段時間某零食購物網站的運營數據。通過現有的數據,應該如何輕松并且準確得來探索他的特征,分析出對自己有價值的信息呢?導入-數據展示數據分析的概念數據分析是通過運用數字化工具和技術,對大批量雜亂無章的數據進行探索和分析,從中發現數據內在的結構和規律,并構建數學模型,進行可視化表達。了解事物的現狀剖析事物的發展趨勢通過驗證,將模型轉化為知識,以便更好地了解事物的現狀、剖析事物的發展趨勢,并預測事物的未來走向。預測事物的未來走向探究新知1.特征探索2.關聯分析3.聚類分析4.建立模型5.模型評價1.特征探索2.關聯分析3.聚類分析4.建立模型數據分析常用方法探究新知數據預處理完成數據清洗數據特征探索求最大值、最小值、極差繪制散點圖,直方圖極差:極差是最大值和最小值之間的差異或范圍;量化了數據的變異程度;提供數據在整個取值范圍內的大小差別。繪制散點圖,直方圖使用最大值、最小值、極差等描述性統計量。觀察分析數據的分布特征12特征探索-主要任務數據清洗:處理缺失值、異常值、重復值求最大值、最小值、極差等描述性統計量繪制散點圖,直方圖觀察分析數據的分布特征1234數據庫的建立在進行數據分析前,通常需要建立一個數據庫。通過建立數據庫,存儲大量數據,方便后續的數據分析和處理工作。導入文件taob.sql中的數據,創建數據庫csdn和數據表taob。探究活動逐個完成“程序5-5-1 數據預處理(教材范例).py”1.數據清洗,發現缺失值,并打印缺失值的個數2.異常處理,利用畫散點圖,發現異常值部分3.設置篩選條件,重新繪制散點圖4.求最大值、最小值、極差等描述性統計量5.繪制價格直方圖6.繪制評論數直方圖結論從直方圖中可以看出,哪些價格區間的商品評論數較低,可能表現不佳,用戶體驗和滿意度較低,可以進行提高改進?1.價格更高的商品,大家的評論的積極性會更強。結論從直方圖中可以看出,哪些價格區間的商品評論數較低,可能表現不佳,用戶體驗和滿意度較低,可以進行提高改進?2.消費者認為價格20—40元的商品價值較低,從而不愿意購買或分享購買體驗。從直方圖中可以看出,哪些價格區間的商品評論數較低,可能表現不佳,用戶體驗和滿意度較低,可以進行提高改進?3.同時價格20—40元的商品可能意味著有潛在的商機和市場空白。結論課堂總結1.對于未知的數據,我們先進行特征探索,以便對數據有初步的認識。2.數據分析下的特征探索的主要任務。數據清洗:處理缺失值、異常值、重復值求最大值、最小值、極差等描述性統計量繪制散點圖,直方圖觀察分析數據的分布特征 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫