資源簡介 (共71張PPT)第二單元 數據處理與應用——經歷數據處理的一般過程在這輸入您的學校名字2023EDUCATION了解數據處理的概念及其過程01認識數據處理的應用價值02了解數據采集的概念03了解數據分析的概念及其方法04目 錄Contents了解數據可視化的概念及其呈現方式05項目要求圍繞中學生移動學習現狀,通過在線問卷調查采集數據,并借助軟件工具完成數據分析和可視化,最后撰寫一份調查報告在班級中交流。復習導入數據信息知識智慧處理轉化內化前瞻性看法經過加工和處理的數據經過人為解讀和經驗充實的信息抽象的內容、獨立時無含義數據處理:是從大量的數據中抽取出有價值信息的過程,即數據轉換成信息的過程。通過對學生考試成績的分析,找出薄弱知識環節,針對性地教學;對歷年高考錄取分數、人數統計分析,預估今年錄取分數,填報志愿;網絡購物平臺根據用戶點擊商品的頻次、滿意度等數據,提供商品排行榜,為用戶選擇商品提供參考慮;新知講解中文輸入法根據用戶的詞頻,調整字詞順序,提高用戶的輸入頻率;過關練習以下選項中,屬于數據處理的目的的是( )A.檢測修正數據B.整合數據資源C.統一數據格式D.提取有用信息新知講解數據處理的一般過程明確目標數據采集數據加工數據分析數據可視化報告撰寫新知講解01明確目標是指明確數據收集的目的,確立收集思路。首先,要思考開展數據收集的原因,即要解決什么問題。然后,要梳理數據收集的思路,搭建收集框架,確定使用哪些收集方法和工具。明確目標明確目標明確數據處理的目的,確立分析思路。解決什么樣的問題?梳理分析思路搭建分析框架確定分析方法和工具新知講解數據采集(第一課)在這輸入您的學校名字2023新課導入如何得到李小明五次考試的成績?新知講解02數據采集是指人們根據需要獲取數據,它是確保數據處理過程有效的基礎。技術工具的發展使得數據采集方式日趨多樣。數據采集新知講解數據的采集方法A數據采集采集數據——方法、工具采集方法 人工獲取 自動采集 調查 訪談 觀察 實驗 文獻調研 物聯網感知 視頻監控 網絡平臺采集工具 問卷 表格 文獻檢索工具 傳感器 攝像機 問卷調查搜索引擎采集軟件網絡爬蟲人直接從社會現象,自然現象或文獻中獲得數據。在信息技術的支持下,通過各種終端設備、網絡數據庫等獲取數據。物聯網感知:是指對在物聯網中使用電子標簽或無線終端標識的智能化物體,通知感知它們的數據變化,采集相關數據,并利用各種通信技術上傳到網絡信息中心存儲。視頻采集:是指借助不同監控點的攝像機采集監控區域的數據。網絡平臺采集:主要是指用戶在訪問網站或使用App時,網絡服務器上安裝的采集軟件自動采集用戶的各種行為數據。數據的時效性、權威性、合法性新知講解過關練習.下列采集信息的方法中,不屬于通過親自探究事物本身獲取信息的是( )。A.觀察B.實驗C.調查D.聽講座新知講解網絡采集——傳感器采集傳感器是能檢測、采集物理世界的各種信息,并將信息轉換為電信號形式表示的數據采集設備。課堂活動尋找傳感器課堂活動尋找傳感器新知講解手機中的傳感器1. 陀螺儀 5. 攝像頭 9. GPS傳感器2.重力傳感器 6. 電磁傳感器 10. 溫度傳感器3.加速度傳感器 7. 距離傳感器 11. 麥克風4.指紋傳感器 8. 光線傳感器 12.氣壓傳感器問題探究網絡采集——傳感器采集傳感器幫助手機實現了很多功能。如果想了解北京今天的天氣情況來確定出行,手機能幫到我們嗎?我們該怎么去了解。。新知講解網絡采集——搜索引擎采集已有網頁數據,比如百度新知講解數據采集網絡采集——爬蟲精確抓取網絡數據1、軟件:集搜客、八爪魚、后羿采集器2、編寫程序注意:不能惡意爬取,不能侵犯個人隱私、不能將爬取信息用于不正當競爭;不能侵犯商業秘密等新知講解數據采集網絡采集——問卷新知講解問卷是為了達到調研目的和采集必要數據而設計的一系列問題。問卷設計的好壞,直接關系到數據采集工作質量的高低。數據采集網絡采集——問卷需要人提供數據過關練習問卷調查法是常用的數據收集方法之一,它與以下哪種方法同屬于直接數據收集( )A.用百度在網上檢索B.查閱紙質文獻C.關注中央新聞D.用傳感器檢測光線值思考與討論在線調查平臺在編輯問卷時,要求先明確每個問題的類型,如單選題、多選題、排序題等。這是為什么?數據采集總結提練明確問題類型后,平臺才能確定答題的方式,從而給出對應的答題樣式設計。在線問卷可以利用平臺中的相關設置來控制數據采集的目標人群和問卷發放數量等數據采集作業布置利用在線調查平臺“設計”發布問卷,并向目標人群發放問卷。數據采集小結數據采集的步驟:數據采集找什么——去哪兒找——怎么找需求確定來源選擇采集的方法將李小明五次考試成績采集到電腦,并以”李小明五次月考成績表“為文件名保存到電腦桌面上。數據分析課堂探究一數據加工、數據分析(第二課)在這輸入您的學校名字2023新課導入李小明同學選擇什么組合更好些呢,為什么?采集到的五次考試成績有什么問題?新課導入李小明同學選擇什么組合更好些呢,為什么?采集到的五次考試成績有什么問題?新知講解03指通過數據編碼、數據清洗、數據重組等一系列過程,使采集到的數據符合數據分析的需求。數據加工指通過數據編碼、數據清洗、數據重組等一系列過程,使采集到的數據符合數據分析的需求。數據加工新知講解指通過數據編碼、數據清洗、數據重組等一系列過程,使采集到的數據符合數據分析的需求。數據清洗(Data cleaning):對數據進行重新審查和校驗的過程,目的在于刪除重復信息、糾正存在的錯誤,并提供數據一致性。數據加工新知講解數據清洗方法:去重刪除重復補漏避免缺失勘誤標準化、異常值修正探究活動勘誤修正異常值補漏補上數據去重刪除重復指通過數據編碼、數據清洗、數據重組等一系列過程,使采集到的數據符合數據分析的需求。數據使用過程中,因為一些增、刪、改等操作,使得數據的分布索引及相關數據會變得比較凌亂,從而影響數據的效率。 數據重組即是將數據的相關信息重新組織。數據加工新知講解數據加工新知講解打開桌面上”李小明五次月考成績表“完成”數據加工整理“表中的數據進行加工整理。數據分析課堂探究一新知講解04數據分析是指用適當的分析方法與工具,對采集到的數據進行分類整理,提取與發現其中有價值的信息,形成結論的過程。數據分析的目的是從描述研究對象的數據中,發現其內在特征和規律。數據分析新知講解數據分析對比預測細分數據分析數據分析的方法描述性分析方法對比分析法平均分析法交叉分析法將兩個或兩個以上的數據進行對比,分析它們的差異,可以分辨數據的性質、變化、發展等個性特征。利用計算平均數的方法,可以反映總體在一定時間、地點下數據特征的一般水平。這是一種立體分析法,它從橫向和縱向兩個方向來計算兩個或多個有聯系的變量在交叉點的統計值。數據分析新知講解數據分析的工具數據分析Excel電子表格WPS表格編寫程序 ——pandas庫新知講解打開桌面上”李小明五次月考成績表“完成”數據分析“表中的任務一、任務二數據分析課堂探究三數據可視化(第三課)在這輸入您的學校名字2023課堂導入如何直觀地將各科成績展現出來呢?數據可視化新知講解05數據可視化是指將數據分析的結果通過表格、圖表、圖形等形式顯示出來,還可以通過這些形式對分析結果進行一些交互處理。利用人對形狀、顏色等特性的感官敏感性,數據可視化能更清晰、有效地幫助人們發現數據間的關系、規律和趨勢,傳遞數據背后的信息。新知講解數據可視化新知講解面積圖條形圖(柱形圖)折線圖餅形圖散點圖雷達圖常見的數據圖表數據可視化新知講解面積圖條形圖(柱形圖)折線圖餅形圖散點圖雷達圖常見的數據圖表主要體現不同項目數據之間的比較。數據可視化新知講解面積圖條形圖(柱形圖)折線圖餅形圖散點圖雷達圖常見的數據圖表折線圖主要反映事物隨時間變化的情況和發展趨勢。數據可視化新知講解面積圖條形圖(柱形圖)折線圖餅形圖散點圖雷達圖常見的數據圖表餅形圖表示各部分在總體所占的百分。數據可視化新知講解面積圖條形圖(柱形圖)折線圖餅形圖散點圖雷達圖常見的數據圖表面積圖一般用于展示或者比較隨時間序列而變化的的定量數據可視化新知講解面積圖條形圖(柱形圖)折線圖餅形圖散點圖雷達圖常見的數據圖表散點圖適用于觀察兩個數值型變量之間是否具有線性關系,散點圖通常用于比較跨類別的聚合數據。散點圖通常用于顯示和比較數值。數據可視化新知講解數據可視化關于散點圖,下列說法正確的是( )A.可呈現變量的頻數分布B.可表示兩種特征間的相關關系C.可描述變量的變化趨勢D.可直觀表述出各指標的位置本題主要考查散點圖的描述。頻率分布直方圖呈現變量的頻數分布,折線圖可描述變量的變化趨勢,散點圖可表示兩種特征間的相關關系,故本題選B選項。新知講解面積圖條形圖(柱形圖)折線圖餅圖形散點圖雷達圖常見的數據圖表雷達圖主要應用于企業經營狀況--收益性、生產性、流動性、安全性和成長性的評價。數據可視化新知講解可視化圖形樹圖動圖、動畫地圖網絡圖熱力圖詞云圖數據可視化新知講解詞云圖地圖“詞云”就是通過形成“關鍵詞云層”或“關鍵詞渲染”,對網絡文本中出現頻率較高的“關鍵詞”的視覺上的突出數據可視化新知講解數據可視化詞云圖是一種數據可視化表達方式。關于下圖所示詞云圖說法正確的是( )A.詞云圖只能通過字體的大小表示關鍵詞的重要程度B.對文本分詞后可直接創建詞云圖,無須特征提取C.從詞云圖可以分析出詞語“父親”比“北京”的出現頻率高D.詞云圖必須顯示該數據集包含的全部詞語。【詳解】本題考查的是詞云圖。詞云圖通過字體的大小和顏色來表示關鍵詞的重要程度,故選項A說法錯誤;創建詞云圖需要特征提取,故選項B說法錯誤;從詞云圖可以分析出詞語“父親”比“北京”的出現頻率高,選項C說法正確;詞云圖過濾掉大量的文本信息,使瀏覽網頁者只要一眼掃過文本就可以領略文本的主旨,故選項D說法錯誤。新知講解數據可視化下圖是對文本數據進行處理生成的“詞云”圖。圖中的詞語顯示有大有小,顯示較大的是因為這個詞( )A.比較重要 B.出現次數較多C.比較關鍵 D.比較流行【詳解】本題主要考查數據可視化處理。圖中的詞語顯示有大有小,顯示較大的是因為這個詞出現次數較多,故本題選B選項。新知講解網絡圖熱力圖樹圖數據可視化新知講解常用的圖表工具數據可視化.WPS表格或Excel等電子表格軟件.在互聯網上有大量優秀的數據可視化工具,如RAW、Infogram、Tableau等。.按自己需要縞程實現。新知講解數據可視化易詞云 - 詞云生成器 https://www.yciyun.com/新知講解06數據可視化是指將數據分析的結果通過表格、圖表、圖形等形式顯示出來,還可以通過這些形式對分析結果進行一些交互處理。利用人對形狀、顏色等特性的感官敏感性,數據可視化能更清晰、有效地幫助人們發現數據間的關系、規律和趨勢,傳遞數據背后的信息。報告撰寫課后探究1、如何快速知道李小明同學那次考得最好?2、按總分由高到低將李小明同學的五次成績重新排列。成果呈現新知講解報告撰寫采集數據——數據的存儲與保護數據存在本地內部數據存儲1數據放在第三方公共或私有的“云端”存儲2數據收集時進行數據精度處理采集數據——數據的存儲與保護數據安全保護技術數據保護1數據的隱私保護2拷貝/FTP備 份復制技術鏡像技術技術手段提高自身保護意識對數據使用者進行道德和法律上的約束數據共享時進行訪問控制數據發布時進行人工干擾數據分析進行數據匿名處理 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫