資源簡介 專題01 數據與信息【學習目標】理解數據與信息的概念及其發展歷史:學生應能夠描述數據和信息的區別,并了解從遠古時代到現代,人類如何使用不同的工具和方法來記錄、存儲和處理數據。這包括對石器刻畫圖案、結繩記事法、文字與數字的出現、造紙術與印刷術的發明等關鍵歷史節點的了解。掌握數據采集和數字化的基本概念:教學目標中需包含對數據采集方式的理解,如傳感器的使用、互聯網和物聯網技術在數據采集中的應用,以及數字化過程,包括采樣、量化和編碼的基礎知識。深入理解數據管理與安全的重要性及策略:學生需要了解數據管理的三個階段(人工管理、文件管理、數據庫管理),并探討如何通過技術手段保護數據安全,包括數據備份、異地容災和數據加密等方法。【思維導圖】【知識梳理】知識點一:感知數據1.數據及其演變原始的石器刻畫圖案 結繩記事 文字與數字的出現 造紙術與印刷術的發明文字與數字的誕生:楔形文字記錄了早期的交易數據,標志著數據記錄的明確化。造紙與印刷:技術進步使數據記錄與傳播更加高效,至今仍在發揮重要作用。圖像與聲音記錄:攝影術和留聲機的發明,使圖像和聲音的保存變得便捷。2.數據及其演變2.現代數據處理與傳輸電子計算機:20世紀40年代誕生,成為數據處理的主要工具。互聯網與大數據:加速了數據傳輸與處理,移動網絡和傳感器普及,大數據滲透生活。多樣化數據記錄形式:數據采集技術發展,數據形式多樣化,影響生活習慣。3.數據與生活日常應用:購物清單、車票中的數據記錄,互聯網技術融入生活,如電子地圖、移動支付、電子票據。數據可視化:股票走勢圖、遷徙圖直觀展現數據變化。互聯網+經濟形態:與傳統行業深度融合,如“互聯網+農業”,提升社會創新力和生產力。4.數據與科學科學證據:數據為科學研究提供客觀證據,如天王星軌道偏差推算海王星。高精尖實驗室:重視實驗室建設,獲取關鍵數據,如CERN的粒子物理學研究,推動科學進步。知識點二:數據、信息與知識1.數據數據是對客觀事物的符號表示,單純的數據是沒有意義的數據的表現形式包括文字、圖形、圖像、音頻和視頻等,數字是最簡單的表現形式。數據的載體是實物,包括書本等。2.信息信息是用來消除隨機不確定性的東西。特征:(1)載體依附性:信息的表示、傳播、存儲必須依附于載體,而不是信息表示的事物。(2)時效性:信息反映的是某一特定時間內的狀態,它會隨時間的推移而變化。(3)共享性:信息是可以傳遞和共享的,可以被重復使用而不會產生損耗。(4)可加工處理性、真偽性:信息是可以加工和處理的。信息有真實信息和虛假信息之分。(5)價值性:信息的價值是相對的,包含顯性價值和隱性價值。3.知識知識是人類在社會實踐中獲得的認識和經驗的總和,也是人類在實踐中認識客觀世界的成果。知識是可以積累和傳承的。4.智慧:全世界只有少部分人具有智慧高科技(航天、人工智能等)、對未來的預測、創造5.數據、信息與知識關系信息是數據經過儲存、分析及解釋后所產生的意義,信息的載體是數據通過歸納、演繹、比較等手段對信息進行挖掘,形成知識舉例:數據:37.5;信息:小明的體溫是37.5攝氏度;知識:正常人的體溫在36.5-37.5之間知識點三:數據采集編碼數據采集采集自然界數據:傳感器(一般由敏感元件、轉換元件、其他輔助元件組成)采集網絡數據:網絡爬蟲進制轉換(1)數據在計算機內部是以二進制方式進行存儲和處理的。(2)常用的數制有:二進制(B)、十進制(D)、十六進制(H)。(3)各進制之間的轉換規則如下:①二進制→十進制 按權展開相加法 例如:1001B=1*23+0*22+0*21+1*20=9D②十六進制→十進制 按權展開相加法 例如:3BH=3*161+11*160=59D③十進制→二進制 除2取余倒序法 例如:29D=11101B(算式如下圖所示)④十進制→十六進制 除16取余倒序法 例如:49D=31H⑤二進制←→十六進制 8421分組轉換法 例如:A9H=10101001B(從低位開始,以四位為一組)存儲容量單位最小的存儲容量單位:比特(bit)(b)基本的存儲容量單位:字節(Byte)(B)1B=8b 1KB=1024B 1MB=1024KB 1GB=1024MB數字化(1)模擬信號和數字信號模擬信號是連續的數字信號是二進制,是離散的,不連續的將模擬信號轉換為數字信號的過程稱為數字化。聲音信號通過傳感器(麥克風)轉化為模擬信號,模擬信號通過ADC模數轉換器(聲卡)轉化為數字信號(2)數字化過程①采樣:每隔一段時間采集樣本,對橫坐標時間軸劃分②量化:將采集到的樣本變為數值,對縱坐標劃分③編碼:編碼是信息從一種形式按照某種規則或格式轉換為另一種形式的過程。解碼是編碼的逆過程。常見的字符編碼有ASCII、Unicode及各種漢字編碼。ASCII碼(美國信息交換標準碼)基本的ASCII碼共有128個對應的十六進制范圍是00~7F,占1個字節。A:41H 65D a:61H 97D 0:30H 空格:20H 10:3130H漢字編碼漢字編碼分為外碼、交換碼、機內碼和字形碼。外碼又叫輸入碼,包括拼音碼、五筆字形碼等(不唯一)交換碼包括ASCII碼、GB2312碼(十六進制)不同的字符集有不同的表示方式,GB2312采用2個字節表示一個漢字。條形碼我國普遍采用的EAN13條形碼。每個編碼都有意義聲音文件存儲容量:采樣頻率(Hz)*量化位數(位)*聲道數*時長(秒)注意:立體聲為2個聲道;44.1kHz為44.1*1000Hz圖像文件存儲容量:總像素*位深度(位)注意:128級灰度是7位;256色是8位;RGB/8是24位視頻文件存儲容量:總像素*位深度*幀數總像素*位深度*幀頻(fps)*時長PAL制式:25fps;NTSC制式:30fps知識點四:數據管理與安全數據管理(1)在大數據出現之前,計算機數據的管理已經經歷了人工管理、文件管理和數據庫管理三個階段。Excel屬于文件管理(2)在計算機中,數據一般以文件的形式存儲。(3)傳統數據庫技術基于結構化數據進行開發,憑借其數據獨立性、數據可共享等特點,已經成為現代社會數據管理的主要方式。數據庫在安全性、易使用、可靠性等方面都取得了令人矚目的成績。(4)文件后綴名音頻文件:.wav(無壓縮) .mp3 .wma視頻文件:.avi(無壓縮) .mp4 .wmv .mpg圖像文件:.bmp(無壓縮) .jpg .gif .png文本文檔:.txt 網頁文件:.html 辦公文檔:.docx .xlsx .ppt數據安全(1)威脅數據安全的因素有很多,如存儲介質損壞、操作失誤、黑客入侵、計算機病毒、遭受自然災害等,從而造成計算機數據被破壞。(2)通過保護存儲數據的介質:磁盤陣列、異地容災、數據備份(3)提高數據本身的安全:數據加密(保密性)、數據校驗(完整性)。知識點五:數據與數據1.大數據的四個特征(1)數據體量巨大。(2)數據類型多。(3)價值密度低。(4)速度快。速度快不僅是指數據產生的速度快,還指數據處理速度快。2.大數據思維(1)大數據采用全體數據分析,而不是抽樣數據。大數據時代仍舊存在抽樣數據(2)大數據不再追求數據的精確性,能夠接受數據的混雜性。(3)不一定強調事物之間的因果關系,更加注重它們的相關性。【題型精講】例1 1用UltraEdit軟件查看“2021高三加油!”的字符內碼,部分界面如圖所示。下列說法正確的是( )A.存儲上述字符需要15個ByteB.字符在計算機內部的編碼為16進制C."2"的ASCII編碼為32H,則可以推算出字符"10"的編碼為3AHD.字符"!"的編碼為A1H【答案】BD【講解】在UltraEdit軟件中查看字符的內碼,可以知道每個字符在計算機內部的編碼為16進制。例如,"2021高三加油!"這句話中的每個字符都有其對應的16進制編碼。對于A選項,存儲上述字符需要15個Byte,這個信息無法從題目中直接得出,因為題目沒有給出具體的字符數量或者每個字符占用的字節數。對于B選項,字符在計算機內部的編碼為16進制,這是正確的。在計算機中,所有的數據都是以二進制的形式存儲的,而16進制是一種常用的表示二進制的方式,因為它可以將每一位二進制數用一個十六進制的數來表示,這樣可以使二進制數據的表示更加直觀和容易處理。對于C選項,"2"的ASCII編碼為32H,則可以推算出字符"10"的編碼為3AH。這個說法是錯誤的。雖然"2"的ASCII編碼是32H,但是我們不能直接推斷出"10"的編碼就是3AH。因為在ASCII編碼表中,字符"10"實際上是由兩個字符組成的:"1"和"0"。所以,我們需要分別找出這兩個字符的ASCII編碼,然后將它們拼接起來才能得到"10"的ASCII編碼。對于D選項,字符"!"的編碼為A1H。這個說法是正確的。在ASCII編碼表中,字符"!"的編碼確實是A1H。例2在數據管理與安全中,下列哪項不是保護數據安全的常見措施?A) 數據加密B) 數據備份C) 數據校驗D) 隨機存儲介質損壞【答案】D【講解】在文章1.4.2數據安全部分,提到了保護數據安全的措施包括磁盤陣列、數據備份、異地容災等手段。選項A“數據加密”和選項B“數據備份”均是常見的數據安全保護措施。選項C“數據校驗”也是確保數據完整性的一種方法。而選項D“隨機存儲介質損壞”實際上是一個不可預測的風險,不屬于主動的數據安全保護措施,因此是不正確的選項。【強化訓練】1.在大數據的概念中,"大數據之‘大’" 不僅指規模、速度和種類的特征,還意味著什么?A. 數據量小B. 數據處理能力強C. 超出以往軟件的處理能力D. 不需要新的集成技術2.以下哪項不是大數據的特征?A. 數據體量巨大B. 處理速度快C. 數據類型單一D. 價值密度低3.在大數據時代,人們分析數據的方式有何不同?A. 仍然依賴于采樣分析B. 只能分析全體數據中的部分信息C. 分析的是全體數據而不是抽樣數據D. 更注重數據的精確性而非相關性4.請簡述大數據的四個主要特征,并舉例說明它們在現實生活中的應用。5.描述數字化過程中的關鍵步驟及其意義。6.闡述大數據對社會的影響,并給出具體例子。參考答案1.C【詳解】“大數據之‘大’”不僅體現在數據的規模、速度和種類上,更重要的是,它超出了傳統軟件工具的處理能力,即C選項。這意味著需要采用新的處理技術和架構來應對大數據的挑戰。2.C【詳解】大數據的特征之一是種類多(Variety),即數據來源廣泛且類型多樣,包括結構化數據、半結構化數據和非結構化數據,因此C選項“數據類型單一”不是大數據的特征。3.C【詳解】在大數據時代,分析方式從依賴于采樣分析轉向分析全體數據,即C選項。這是因為大數據技術能夠處理和分析海量信息,而不僅僅是數據的子集,這樣可以獲得更全面的洞察。4.大數據的四個主要特征是:體量、速度、種類、價值。【詳解】體量:指的是數據量的龐大,例如社交媒體每天產生的數據量,這要求有高效的大數據存儲和處理能力。速度:指數據產生的速率快,如實時交易數據,需要實時或近實時的處理能力。種類:數據來源多樣,包括文本、圖像、視頻等,需要復雜的數據處理技術。價值:雖然數據量大,但有價值的信息可能稀少,需要從海量數據中提取有價值的信息,如通過數據分析預測市場趨勢。5.數字化過程中的關鍵步驟包括:數據采集、數據預處理、數據存儲、數據分析、數據可視化。【詳解】數據采集:收集來自各種源的原始數據,是數字化過程的起點,確保數據的完整性和準確性。數據預處理:清洗和轉換數據,去除噪聲和不一致性,為后續分析做準備。數據存儲:使用高效的數據存儲技術,如分布式文件系統,確保數據的可訪問性和安全性。數據分析:應用統計學、機器學習等技術,從數據中提取知識和洞察。數據可視化:將分析結果以圖表等形式展現,便于理解和決策。6.大數據對社會的影響包括提升決策的效率和準確性、優化業務流程、推動個性化服務、加強社會安全等。【詳解】大數據對社會的影響廣泛,例如:提升決策效率:政府和企業可以基于大數據分析做出更加科學的決策,如交通規劃、疾病預測等。個性化服務:電商和社交媒體通過分析用戶行為,提供個性化推薦,改善用戶體驗。優化業務流程:制造和物流行業利用大數據優化供應鏈管理,減少浪費,提高效率。加強社會安全:通過大數據分析,可以預測犯罪模式,提前采取措施,保護公共安全。具體例子:谷歌的流感趨勢預測,通過分析用戶搜索行為,提前幾周預測流感爆發,為公共衛生部門提供決策支持。 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫