資源簡介 (共66張PPT)中等職業(yè)學校公共基礎(chǔ)課程教材信息技術(shù)(基礎(chǔ)模塊)(下冊)數(shù)據(jù)處理——讓數(shù)據(jù)提供有價值的信息模塊4目錄采集數(shù)據(jù)項目4.1 加工數(shù)據(jù)項目4.2 分析數(shù)據(jù)項目4.3 初識大數(shù)據(jù)項目4.4 相關(guān)知識相關(guān)知識1.常用圖文編輯軟件和工具2.文檔的基本操作3.文檔的信息操作項目4.1 操作圖文編輯軟件1.數(shù)據(jù)與數(shù)據(jù)處理數(shù)據(jù)是指對客觀事件進行記錄并可以鑒別的,能對客觀事物的性質(zhì)、狀態(tài)以及相互關(guān)系等進行記載的物理符號或符號組合。數(shù)據(jù)可以分為結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)。2.常用的數(shù)據(jù)處理軟件數(shù)據(jù)處理的不同環(huán)節(jié),可能會涉及不同軟件的使用,例如采集環(huán)節(jié)可以使用專業(yè)的采集軟件,加工環(huán)節(jié)和分析環(huán)節(jié)可以使用Excel、WPS表格等軟件,下圖為常用的數(shù)據(jù)處理軟件及其特點。3.數(shù)據(jù)的輸入、導入和引用在Excel中可以輸入各種類型的數(shù)據(jù),如文本、數(shù)字、身份證、小數(shù)、貨幣等,也可以快速填充有規(guī)律的數(shù)據(jù),如學號這類等差序列。當需要輸入普通數(shù)據(jù)時,只需在工作表中選擇單元格,然后輸入數(shù)據(jù)并按【Enter】鍵;當需要輸入有規(guī)律的數(shù)據(jù),如等差序列時,可首先在單元格中輸入起始數(shù)據(jù),如輸入“1”然后按住【Ctrl】鍵的同時拖曳該單元格右下角的填充柄,填充等差序列。(1)數(shù)據(jù)輸入3.數(shù)據(jù)的輸入、導入和引用在“數(shù)據(jù)”/“獲取外部數(shù)據(jù)”組中單擊“自文本”按鈕,打開“導入文本文件”對話框,選擇文本文件對象,單擊“導入”按鈕。(2)數(shù)據(jù)導入3.數(shù)據(jù)的輸入、導入和引用數(shù)據(jù)引用是指引用工作簿、網(wǎng)絡(luò)或計算機中的其他數(shù)據(jù), 其方法為: 在“ 數(shù)據(jù)”/“獲取外部數(shù)據(jù)”組中單擊“現(xiàn)有連接”按鈕,打開“現(xiàn)有連接”對話框,選擇需要連接的文件,單擊“導入”按鈕,然后根據(jù)提示設(shè)置引用范圍和導入位置,引用指定文件中的數(shù)據(jù)。(3)數(shù)據(jù)引用4.設(shè)置數(shù)據(jù)類型和美化數(shù)據(jù)選擇數(shù)據(jù)所在的單元格或單元格區(qū)域,在“開始”/“數(shù)字”組的“數(shù)據(jù)類型”下拉列表框中選擇需要的類型選項。如果該組中現(xiàn)有的參數(shù)和按鈕無法滿足需要,可單擊“展開”按鈕,在打開的“設(shè)置單元格格式”對話框的“數(shù)字”選項卡中進行精確設(shè)置。(1)設(shè)置數(shù)據(jù)類型3.數(shù)據(jù)的輸入、導入和引用合適的字體和對齊方式,有助于數(shù)據(jù)信息的表達。當我們需要設(shè)置數(shù)據(jù)的字體或?qū)R方式時,可選擇數(shù)據(jù)所在的單元格區(qū)域,在“開始”選項卡的“字體”組或“對齊方式”組中進行設(shè)置,也可單擊各組的“展開”按鈕打開“設(shè)置單元格格式”對話框中對應的選項卡,在其中進行精確設(shè)置。其中,“字體”組打開“設(shè)置單元格格式”對話框的“字體”選項卡,“對齊方式”組打開“設(shè)置單元格格式”對話框的“對齊”選項卡。(2)設(shè)置數(shù)據(jù)字體和對齊方式3.數(shù)據(jù)的輸入、導入和引用單元格中的數(shù)據(jù)可以進行格式設(shè)置,單元格本身也可以設(shè)置邊框和填充格式。我們同樣可以借助上圖中的“邊框”選項卡和“填充”選項卡設(shè)置單元格格式,也可以按照以下兩種方法快速為單元格應用樣式。應用單元格樣式。選擇單元格或單元格區(qū)域,在“開始”/“樣式”組的“單元格樣式”下拉列表框中選擇某種樣式。套用表格格式。選擇需要套用表格格式的單元格區(qū)域,在“開始”/“樣式”組中單擊“套用表格格式”按鈕。(3)美化單元格項目任務(wù)任務(wù)1 讓八瓜魚幫忙采集數(shù)據(jù)下面以京東的“商品搜索”模板為例,介紹模板采集的實現(xiàn)方法,其具體操作如下。用新建模板任務(wù)使用京東商品搜索模板項目任務(wù)任務(wù)1 讓八瓜魚幫忙采集數(shù)據(jù)用設(shè)置采集參數(shù)項目任務(wù)任務(wù)1 讓八瓜魚幫忙采集數(shù)據(jù)用選擇采集方式完成數(shù)據(jù)采集指定導出方式設(shè)置導出位置和文件名稱項目任務(wù)任務(wù)1 讓八瓜魚幫忙采集數(shù)據(jù)用導出完成查看采集到的數(shù)據(jù)項目任務(wù)任務(wù)2 數(shù)據(jù)類型轉(zhuǎn)換及格式化處理下面練習對采集到Excel中的數(shù)據(jù)進行設(shè)置,通過本任務(wù)將練習到包括行高、列寬、字體格式、對齊方式、數(shù)據(jù)類型、邊框格式、填充格式等一系列數(shù)據(jù)格式設(shè)置的方法,設(shè)置前后的對比效果如下圖所示。用項目任務(wù)任務(wù)2 數(shù)據(jù)類型轉(zhuǎn)換及格式化處理用設(shè)置單列列寬精確設(shè)置列寬值項目任務(wù)任務(wù)2 數(shù)據(jù)類型轉(zhuǎn)換及格式化處理用設(shè)置多列列寬精確設(shè)置多列列寬值項目任務(wù)任務(wù)2 數(shù)據(jù)類型轉(zhuǎn)換及格式化處理用加粗字體設(shè)置帶1位小數(shù)的百分比數(shù)據(jù)類型項目任務(wù)任務(wù)2 數(shù)據(jù)類型轉(zhuǎn)換及格式化處理用添加外邊框設(shè)置填充顏色目錄采集數(shù)據(jù)項目4.1 加工數(shù)據(jù)項目4.2 分析數(shù)據(jù)項目4.3 初識大數(shù)據(jù)項目4.4 相關(guān)知識相關(guān)知識1.數(shù)據(jù)清理2.數(shù)據(jù)計算3.數(shù)據(jù)管理項目4.2 加工數(shù)據(jù)1.數(shù)據(jù)清理選擇數(shù)據(jù)所在的單元格或單元格區(qū)域,在“開始”/“數(shù)字”組的“數(shù)據(jù)類型”下拉列表框中選擇需要的類型選項。如果該組中現(xiàn)有的參數(shù)和按鈕無法滿足需要,可單擊“展開”按鈕,在打開的“設(shè)置單元格格式”對話框的“數(shù)字”選項卡中進行精確設(shè)置。(1)設(shè)置數(shù)據(jù)類型1.數(shù)據(jù)清理數(shù)據(jù)清理主要是對重復的數(shù)據(jù)進行篩選清除,將缺失的數(shù)據(jù)補充完整,對錯誤的數(shù)據(jù)更正等。2.數(shù)據(jù)計算數(shù)據(jù)計算是指對數(shù)據(jù)進行各種算術(shù)和邏輯運算,以便得到進一步的有用信息。在Excel中,數(shù)據(jù)計算最常用的方法是使用公式和函數(shù)進行運算。使用公式:使用函數(shù):3.數(shù)據(jù)管理數(shù)據(jù)管理是指對數(shù)據(jù)進行排序、篩選、分類匯總等操作,通過這些操作可以將數(shù)據(jù)加工成數(shù)據(jù)分析時需要的內(nèi)容。數(shù)據(jù)排序:3.數(shù)據(jù)管理數(shù)據(jù)篩選:數(shù)據(jù)分類匯總:項目任務(wù)任務(wù)1 清理重復數(shù)據(jù)并計算培訓成績本任務(wù)將利用Excel的“刪除重復項”功能清理表格中的重復數(shù)據(jù),然后利用公式和函數(shù)計算每個學生的培訓成績,制作后的表格參考效果如下圖所示。用項目任務(wù)任務(wù)1 清理重復數(shù)據(jù)并計算培訓成績單擊“刪除重復項”按鈕指定檢查重復項的兩個項目項目任務(wù)任務(wù)1 清理重復數(shù)據(jù)并計算培訓成績選擇“SUM”選項選擇單元格區(qū)域項目任務(wù)任務(wù)1 清理重復數(shù)據(jù)并計算培訓成績輸入公式填充公式項目任務(wù)任務(wù)2 管理計算機配件價格數(shù)據(jù)本任務(wù)將練習在表格中對計算機配件按價格進行排序,篩選出指定配件的價格數(shù)據(jù),并對各類配件的平均價格進行分類匯總,制作后的參考效果如下圖所示。用項目任務(wù)任務(wù)2 管理計算機配件價格數(shù)據(jù)用單擊“排序”按鈕設(shè)置主要關(guān)鍵字項目任務(wù)任務(wù)2 管理計算機配件價格數(shù)據(jù)用設(shè)置次要關(guān)鍵字排序結(jié)果項目任務(wù)任務(wù)2 管理計算機配件價格數(shù)據(jù)用按數(shù)字篩選自定義篩選項目任務(wù)任務(wù)2 管理計算機配件價格數(shù)據(jù)用設(shè)置分類匯總查看匯總結(jié)果目錄采集數(shù)據(jù)項目4.1 加工數(shù)據(jù)項目4.2 分析數(shù)據(jù)項目4.3 初識大數(shù)據(jù)項目4.4 相關(guān)知識相關(guān)知識1.數(shù)據(jù)可視化與分析方法2.圖表的類型與組成項目4.3 分析數(shù)據(jù)1.數(shù)據(jù)可視化與分析方法常用的可視化分析方法主要有以下幾種。對比分析:1.數(shù)據(jù)可視化與分析方法趨勢分析:1.數(shù)據(jù)可視化與分析方法占比分析: 分布分析:2.圖表的類型與組成一般來說,數(shù)據(jù)對比可視化分析時,常用到的圖表類型有柱形圖、條形圖等;數(shù)據(jù)對比可視化分析時,常用到的圖表類型有折線圖、面積圖等;數(shù)據(jù)占比可視化分析時,常用到的圖表類型有餅圖、圓環(huán)圖等;數(shù)據(jù)分布可視化分析時,常用到的圖表類型有散點圖、氣泡圖、直方圖等。下圖即為二維柱形圖。項目任務(wù)任務(wù)1 綜合應用多種圖表分析數(shù)據(jù)本任務(wù)將利用柱形圖、折線圖和餅圖依次分析材料采購表格中上半年各材料的采購量對比情況、單個材料的采購量趨勢變化情況,以及不同類別材料的采購量占比情況,制作后的參考效果如右圖所示。用項目任務(wù)任務(wù)1 綜合應用多種圖表分析數(shù)據(jù)用自動求和選擇圖表類型項目任務(wù)任務(wù)1 綜合應用多種圖表分析數(shù)據(jù)用設(shè)置坐標軸應用圖表樣式項目任務(wù)任務(wù)1 綜合應用多種圖表分析數(shù)據(jù)用設(shè)置數(shù)據(jù)系列格式選擇圖表類型項目任務(wù)任務(wù)1 綜合應用多種圖表分析數(shù)據(jù)用美化圖表添加數(shù)據(jù)標簽項目任務(wù)任務(wù)1 綜合應用多種圖表分析數(shù)據(jù)用復制數(shù)據(jù)選擇圖表樣式項目任務(wù)任務(wù)1 綜合應用多種圖表分析數(shù)據(jù)用設(shè)置圖表樣式和標題設(shè)置數(shù)據(jù)標簽項目任務(wù)任務(wù)2 使用數(shù)據(jù)透視圖表對象分析數(shù)據(jù)下面便在表格中創(chuàng)建數(shù)據(jù)透視表和數(shù)據(jù)透視圖對象,使用它們來分析數(shù)據(jù),如下圖所示。用項目任務(wù)任務(wù)2 使用數(shù)據(jù)透視圖表對象分析數(shù)據(jù)用創(chuàng)建數(shù)據(jù)透視表指定數(shù)據(jù)透視表位置項目任務(wù)任務(wù)2 使用數(shù)據(jù)透視圖表對象分析數(shù)據(jù)用添加字段更改字段項目任務(wù)任務(wù)2 使用數(shù)據(jù)透視圖表對象分析數(shù)據(jù)用移動圖表指定圖表位置和名稱項目任務(wù)任務(wù)2 使用數(shù)據(jù)透視圖表對象分析數(shù)據(jù)用調(diào)整字段篩選數(shù)據(jù)項目任務(wù)任務(wù)2 使用數(shù)據(jù)透視圖表對象分析數(shù)據(jù)用電風扇各季度銷量趨勢各家電全年銷售占比項目任務(wù)任務(wù)2 使用數(shù)據(jù)透視圖表對象分析數(shù)據(jù)用設(shè)置數(shù)據(jù)標簽目錄采集數(shù)據(jù)項目4.1 加工數(shù)據(jù)項目4.2 分析數(shù)據(jù)項目4.3 初識大數(shù)據(jù)項目4.4 相關(guān)知識相關(guān)知識1.大數(shù)據(jù)基礎(chǔ)知識2.大數(shù)據(jù)采集3.大數(shù)據(jù)分析項目4.4 初識大數(shù)據(jù)1.大數(shù)據(jù)基礎(chǔ)知識總體而言,大數(shù)據(jù)發(fā)展經(jīng)歷了4個重要的階段。(1)發(fā)展1.大數(shù)據(jù)基礎(chǔ)知識大數(shù)據(jù)是海量、高速增長和多樣化的信息資產(chǎn),它具有數(shù)據(jù)體量大、數(shù)據(jù)類型多、數(shù)據(jù)產(chǎn)生速度快、數(shù)據(jù)價值密度低等特點。(2)特點1.大數(shù)據(jù)基礎(chǔ)知識(3)用途電商大數(shù)據(jù)零售大數(shù)據(jù)農(nóng)業(yè)大數(shù)據(jù)金融大數(shù)據(jù)交通大數(shù)據(jù)教育大數(shù)據(jù)醫(yī)療大數(shù)據(jù)生物大數(shù)據(jù)2.大數(shù)據(jù)采集物聯(lián)網(wǎng)的數(shù)據(jù)大部分是非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),采集的方式主要包括報文和文件兩種。報文是根據(jù)用戶設(shè)置的采集頻率進行數(shù)據(jù)傳輸,并將數(shù)據(jù)信息存放到消息總線中實現(xiàn)采集;文件則是通過各種物聯(lián)網(wǎng)設(shè)備連續(xù)不斷地發(fā)送數(shù)據(jù),并形成一個或多個文件以便采集。(1)物聯(lián)網(wǎng)系統(tǒng)數(shù)據(jù)的采集2.大數(shù)據(jù)采集互聯(lián)網(wǎng)系統(tǒng)是另一個重要的數(shù)據(jù)采集渠道,整個互聯(lián)網(wǎng)系統(tǒng)涵蓋了大量的數(shù)據(jù),并且這些數(shù)據(jù)的價值密度較高。目前,針對互聯(lián)網(wǎng)系統(tǒng)的數(shù)據(jù)采集通常是通過網(wǎng)絡(luò)“爬蟲”工具來實現(xiàn),例如可以通過Python或Java語言來完成“爬蟲”的編寫,通過在“爬蟲”上增加一些智能化的操作,將非結(jié)構(gòu)化的信息從大量的網(wǎng)頁中抽取出來以結(jié)構(gòu)化的方式存儲,或直接存入本地數(shù)據(jù)庫中,以實現(xiàn)自動采集工作。(1)互聯(lián)網(wǎng)系統(tǒng)數(shù)據(jù)的采集3.大數(shù)據(jù)分析大數(shù)據(jù)分析的過程通常包括數(shù)據(jù)采集、導入、預處理、統(tǒng)計分析、展現(xiàn)等步驟。在合適的工具輔助下,對不同類型的數(shù)據(jù)源進行融合、取樣和分析,按照一定的標準統(tǒng)一存儲數(shù)據(jù),并通過去噪等數(shù)據(jù)分析技術(shù)對其進行降維處理,然后進行分類,最后提取信息,選擇可視化認證等方式將結(jié)果展示給終端用戶。項目任務(wù)大數(shù)據(jù)在生活中的應用請根據(jù)自己的所見所聞,將大數(shù)據(jù)在生活中的應用情況填寫到表4-1中。用日常生活 大數(shù)據(jù)應用情況飲食出行學習運動就職醫(yī)療租房購物娛樂感謝聆聽信息技術(shù)(基礎(chǔ)模塊)(下冊) 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫