資源簡介 (共20張PPT)第一章數(shù)據(jù)與信息1、感知數(shù)據(jù)2、數(shù)據(jù)、信息和知識3、數(shù)據(jù)采集與編碼4、數(shù)據(jù)管理與安全5、數(shù)據(jù)與大數(shù)據(jù)學(xué)習(xí)目標123數(shù)據(jù)管理。數(shù)據(jù)安全,影響數(shù)據(jù)安全的因素及防護手段。了解常見的數(shù)據(jù)校驗方法4大數(shù)據(jù)的概念。5大數(shù)據(jù)的特征。6大數(shù)據(jù)對社會的影響12重點難點重點:數(shù)據(jù)管理、大數(shù)據(jù)的特征和思維難點:影響數(shù)據(jù)安全的因素及防護手段。大數(shù)據(jù)的思維。數(shù)據(jù)管理是利用計算機硬件和軟件技術(shù)對數(shù)據(jù)進行有效收集、存儲、處理和應(yīng)用的過程。計算機數(shù)據(jù)管理的三個階段計算機一般采用樹形目錄結(jié)構(gòu)來管理文件,如圖1.4.1所示。在windows系統(tǒng)中,則采用了更為形象的文件夾來管理文件。如圖1.4.2所示。手機有多少的傳感器數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)定義的數(shù)據(jù)模型,是不方便用數(shù)據(jù)庫二維邏輯表來表現(xiàn)的數(shù)據(jù)。包括各類格式的辦公文檔、文本、圖片、XML、HTML、各類報表、圖像、音頻、視頻等。非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù),也稱作行數(shù)據(jù),是由二維表結(jié)構(gòu)來進行邏輯表達和實現(xiàn)的數(shù)據(jù),嚴格地遵循數(shù)據(jù)格式與長度規(guī)范,主要通過關(guān)系型數(shù)據(jù)庫進行存儲和管理。結(jié)構(gòu)化數(shù)據(jù)拓展鏈接:結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)半結(jié)構(gòu)化數(shù)據(jù),就是介于結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)之間的數(shù)據(jù),具有一定的結(jié)構(gòu)性。半結(jié)構(gòu)化數(shù)據(jù)感染計算機病毒硬盤驅(qū)動器損壞遭受自然災(zāi)害操作失誤黑客入侵數(shù)據(jù)安全MD5CRCSHA常見的數(shù)據(jù)校驗方法磁盤陣列數(shù)據(jù)備份異地容災(zāi)目前采用的主動防護手段大數(shù)據(jù)概念中國網(wǎng)民數(shù)量:7.51億半年增長率:2.7%中國注冊網(wǎng)站數(shù)量:344.3萬個手機網(wǎng)民:7.236億占網(wǎng)民總數(shù):96.3%月均網(wǎng)絡(luò)交易:16億筆每日新發(fā)微博數(shù)量: 1億+條注冊微博用戶數(shù): 2.9071億發(fā)布的網(wǎng)頁數(shù)量:866億頁年增速:~40%網(wǎng)絡(luò)直播用戶:3.43億占網(wǎng)民總數(shù):47.1%大數(shù)據(jù)概念圖公司(SGI) 的一位科學(xué)家正式提出。2016年,數(shù)據(jù)科學(xué)家將大數(shù)據(jù)正式定義為:大數(shù)據(jù)代表著信息量大、速度快、種類繁多的信息資產(chǎn),需要特定的技術(shù)和分析方法將其轉(zhuǎn)化。為價值。也就是說,大數(shù)據(jù)之“大”, 不僅指規(guī)模、速度和種類的特征,還意味著它超出以往常用的數(shù)據(jù)采集、組織、 管理和加工等軟件的處理能力,要求新型集成技術(shù)從多元、復(fù)雜和巨量規(guī)模的數(shù)據(jù)集里洞察規(guī)律。數(shù)據(jù)類型多數(shù)據(jù)來自多種數(shù)據(jù)源,其數(shù)據(jù)各類與格式不可能保持一致,各種結(jié)構(gòu)化,半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)共存。價值密度低數(shù)據(jù)之間關(guān)聯(lián)性支持深層的數(shù)據(jù)挖掘。數(shù)據(jù)龐大,發(fā)揮作用的是其中非常小的部分。大數(shù)據(jù)的特點-4V理論速度快一是數(shù)據(jù)產(chǎn)生的速度快。有的數(shù)據(jù)是爆發(fā)式產(chǎn)生的,有的數(shù)據(jù)是累積產(chǎn)生的。二是數(shù)據(jù)處理的速度快。數(shù)據(jù)規(guī)模大從TB躍升到PB甚至EB。 一組公式:1024GB=1TB; 1024TB=1PB;1024PB=1EB。不一定強調(diào)對事物因果關(guān)系的探求,而是更加注重它們的相關(guān)性。首先其次再次大數(shù)據(jù)要分析的是全體數(shù)據(jù),而不是抽樣數(shù)據(jù)。對于數(shù)據(jù)不再追求精確性,而是能夠接受數(shù)據(jù)的混雜性。大數(shù)據(jù)的弊端1、個人數(shù)據(jù)隱私與安全大數(shù)據(jù)會記錄你的瀏覽習(xí)慣,購買習(xí)慣,常用淘寶支付寶這些軟件的人,你的消費能力、購物習(xí)慣、活動產(chǎn)所、收入情況、生活質(zhì)量、年齡、身高、體重、鞋碼、三圍、口味等,都是可以分析出來的 這些基本囊括了我們的生活。個人數(shù)據(jù)安全就成了一個大問題,一旦數(shù)據(jù)泄露(或被買賣),可能會對用戶人身財產(chǎn)、國家和公司的安全造成威脅。大數(shù)據(jù)的弊端2、大數(shù)據(jù)殺熟殺熟,即同樣的商品或服務(wù),老客戶看到的價格反而比新客戶要貴出許多。近兩年來包括滴滴出行、攜程、飛豬、京東、美團、淘票票等多家互聯(lián)網(wǎng)平臺均被曝疑似存在“殺熟”情況,涵蓋在線差旅、在線票務(wù)、網(wǎng)絡(luò)購物、交通出行等多個領(lǐng)域,特別是OTA(Online Travel Agent)在線差旅平臺較為突出。大數(shù)據(jù)技能自身不只能夠迅速衍生為新興信息產(chǎn)業(yè),還能夠同云計算、物聯(lián)網(wǎng)和才智工程技能聯(lián)動,支撐一個信息技能的新時代。加米谷大數(shù)據(jù)培訓(xùn)。1. 大數(shù)據(jù)的特征可以用被總結(jié)為4V特征,以下哪個不屬于大數(shù)據(jù)的4V特征( )A.種類多(Variety)B.體量大(Volume)C.Venture(風(fēng)險大)D.速度快(Velocity)2. IBM副總裁Ditetrich曾說過“可以體用社交平臺數(shù)據(jù)獲得用戶對某個產(chǎn)品的評價,但往往上百條紀律中只有很小的一部分真正討論這款產(chǎn)品”。這主要體現(xiàn)了大數(shù)據(jù)的( )特征A.價值密度低 B.數(shù)據(jù)變化速度快C. 數(shù)據(jù)類型多 D. 數(shù)據(jù)體量巨大CA3. 脫去數(shù)據(jù)的保護層,把密文變成明文的過程稱為( )A.加密B.解密算法C.加密算法D.解密4.半結(jié)構(gòu)化數(shù)據(jù)包括( )A.Excel表格B.銀行賬戶上的消費記錄C.檢查身體后得到的體檢報告D.HTML文檔DD5.關(guān)于密碼,下列說法不正確的是( )A. 密碼強度要高B. 重要網(wǎng)站、郵箱、銀行卡密碼要獨立C. 不要在陌生的電腦上輸入密碼D. 經(jīng)常使用電話或生日做密碼D1.經(jīng)常接到賣房電話、貸款電話,他們怎么知道我們的號碼?2.當(dāng)你的手機丟了,如何將損失降到最低?3.密碼的設(shè)置要求有哪些?P25討論Thanks 展開更多...... 收起↑ 資源預(yù)覽 縮略圖、資源來源于二一教育資源庫