資源簡(jiǎn)介 (共27張PPT)5.1 認(rèn)識(shí)大數(shù)據(jù)我們身處大數(shù)據(jù)時(shí)代1了解大數(shù)據(jù)的概念, 能判斷某些場(chǎng)景是否應(yīng)用了大數(shù)據(jù)。3學(xué)習(xí)目標(biāo)2理解大數(shù)據(jù)的特征, 明晰傳統(tǒng)數(shù)據(jù)與大數(shù)據(jù)的區(qū)別。知道大數(shù)據(jù)對(duì)日常生活的影響, 能有意識(shí)地規(guī)避個(gè)人信息安全隱患。大數(shù)據(jù)(big data)是指無(wú)法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行高效捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的數(shù)據(jù)資產(chǎn)。什么是大數(shù)據(jù)?(從大數(shù)據(jù)產(chǎn)生的角度)任務(wù)1:閱讀案例,與小組成員討論交流,從案例中歸納出大數(shù)據(jù)有哪些特征。大數(shù)據(jù)的特征案例1互聯(lián)網(wǎng)時(shí)代,我們每天接觸的資訊量相當(dāng)于15世紀(jì)的人一生的資訊總量,且全球數(shù)據(jù)量正以大爆發(fā)的速度持續(xù)增長(zhǎng),預(yù)計(jì)到2024年全球數(shù)據(jù)總量將達(dá)143ZB。換算一下,若這143ZB全部是電影,按每部電影1GB計(jì)算,全國(guó)14億人每天24小時(shí)不停地觀看,大約需要50年才能看完。案例2案例3案例5我國(guó)的“天網(wǎng)”系統(tǒng)是世界上最大的監(jiān)控網(wǎng)絡(luò),有超過(guò)2000萬(wàn)個(gè)攝像頭。車站、銀行、交通路口等要害位置的視頻監(jiān)控24小時(shí)不停運(yùn)轉(zhuǎn),但所收集到的數(shù)據(jù)絕大多數(shù)是無(wú)用的。對(duì)公安機(jī)關(guān)破案來(lái)說(shuō),幾十個(gè)小時(shí)的監(jiān)控畫面中有用的可能只有幾秒。案例4微信上每天約有400億條信息被發(fā)送,每秒信息發(fā)送量超過(guò)450萬(wàn)條。微信信息類型多種多樣,包括數(shù)字、文字、圖像、聲音、視頻、文件、地理位置信息、表情、紅包、轉(zhuǎn)賬信息、聊天記錄、名片信息等各種類型。世界上每臺(tái)汽車都會(huì)實(shí)時(shí)發(fā)送信息給制造商,發(fā)送頻率一般為每15秒至1分鐘一條。通過(guò)分析報(bào)文,汽車制造商能實(shí)時(shí)掌握汽車信息、了解汽車狀況。以豐田汽車為例,2022年豐田全球銷量為1050萬(wàn)臺(tái),也就是說(shuō),僅2022年售出的汽車每分鐘就會(huì)發(fā)回至少1050萬(wàn)條報(bào)文。大數(shù)據(jù)是與人類的網(wǎng)絡(luò)行為伴隨產(chǎn)生的,物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、手機(jī)、電腦、導(dǎo)航系統(tǒng)、遍布全球各個(gè)角落的各種各樣的傳感器……,都是大數(shù)據(jù)的來(lái)源或承載方式。世界上每時(shí)每刻都有不計(jì)其數(shù)的數(shù)據(jù)在源源不斷產(chǎn)生,數(shù)量巨大到無(wú)法完全統(tǒng)計(jì)。量大量大、更新快量大、更新快量大、類型多、更新快量大、無(wú)用數(shù)據(jù)多大數(shù)據(jù)的“4V”特征:數(shù)據(jù)體量巨大大量(Volume)數(shù)據(jù)類型多樣多樣(Variety)混雜著大量無(wú)價(jià)值或價(jià)值很小的數(shù)據(jù)低價(jià)值密度(Value)數(shù)據(jù)的更新變化速度快高速(Velocity)根據(jù)信息存儲(chǔ)全球領(lǐng)導(dǎo)廠商EMC公司的界定,規(guī)模至少在10TB左右的數(shù)據(jù)集合才能被稱為大數(shù)據(jù)。若你的手機(jī)拍出的照片每張約5MB。你每天拍100張照片并保存下來(lái),要存滿10TB大約需要多少年?(提示:1TB=1024GB=1024*1024MB)任務(wù)2:通過(guò)計(jì)算感受大數(shù)據(jù)有多“大”求解過(guò)程:所需年數(shù)=數(shù)據(jù)總量/(每張照片的數(shù)據(jù)量*每天拍的照片數(shù)*365天)=10TB/(5MB*100*365)=10*1024*1024*1024MB /(5MB*100*365)≈57.5(年)分布式并行計(jì)算分布式存儲(chǔ)大數(shù)據(jù)的特征(從存儲(chǔ)與計(jì)算的角度)案例2:分布式計(jì)算工程 Folding@home將巨大的計(jì)算任務(wù)拆解,分配世界各地的志愿者,在志愿者的計(jì)算機(jī)不忙碌時(shí)調(diào)用其中央處理器進(jìn)行計(jì)算。目前該工程的計(jì)算速度已與世界上最快的超級(jí)計(jì)算機(jī)算力相當(dāng),超過(guò)了每秒100億億次。分布式驚人的算力案例1:2003年,人類第一次破譯人體基因密碼的時(shí)候,辛苦工作了十年才完成了三十億對(duì)堿基對(duì)的排序。大約十年之后,采用分布式處理的世界范圍內(nèi)的基因儀15分鐘就可以完成同樣的工作。大數(shù)據(jù)時(shí)代的思維方式大數(shù)據(jù)時(shí)代的預(yù)言家維克托 邁爾 舍恩伯格全量思維容錯(cuò)思維相關(guān)性思維大數(shù)據(jù)時(shí)代的思維方式全量思維趨向于收集和分析與某事物相關(guān)的所有事物,而不是只依靠抽樣所得的少量樣本數(shù)據(jù)。大數(shù)據(jù)時(shí)代的思維方式容錯(cuò)思維適當(dāng)忽略微觀層面的精確度,適當(dāng)追求模糊,只要掌握了大致的發(fā)展方向即可。相關(guān)性思維不再熱衷于尋找因果關(guān)系,而注重尋找事物間的相關(guān)關(guān)系,重要的是探求“是什么”,而不是“為什么”(大數(shù)據(jù)的互聯(lián)網(wǎng)思維特征)(“樣本漸趨于總體”特征)(“精確讓位于模糊”特征)(“相關(guān)性重于因果”特征)《撐陽(yáng)傘的女人》(法國(guó)印象派大師莫奈的名作)容錯(cuò)思維全量思維案 例 體現(xiàn)的思維方式用戶在社交網(wǎng)絡(luò)上發(fā)送信息并不遵循嚴(yán)格的語(yǔ)法規(guī)則,很多語(yǔ)句不完整、有語(yǔ)法錯(cuò)誤或拼寫錯(cuò)誤,但仍然可以被信息接收方理解,也仍然能被信息服務(wù)商分析和使用,為其創(chuàng)造價(jià)值。美國(guó)一家公司將收集到的大量二手汽車數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)橙色汽車有質(zhì)量問(wèn)題的可能性只有其他顏色車的一半。面對(duì)分析結(jié)果,二手車經(jīng)銷商們并不去想”為什么“,他們想的是快去收購(gòu)橙色二手車,或者把倉(cāng)庫(kù)里的二手車刷成橙色。新冠肺炎疫情防控期間,如果有一例確診,就要追溯與之有關(guān)的所有人員。大數(shù)據(jù)技術(shù)支持的全樣本分析能在最短的時(shí)間里找到幾乎所有的相關(guān)人員。沃爾瑪公司發(fā)現(xiàn)颶風(fēng)來(lái)臨前手電筒等應(yīng)急用品的銷量增加,蛋撻銷量也增加。于是他們總在風(fēng)暴前把蛋撻放在颶風(fēng)用品銷售區(qū)附近。任務(wù)3:分析案例所體現(xiàn)的思維方式。容錯(cuò)思維相關(guān)性思維全量思維、相關(guān)性思維相關(guān)性思維任務(wù)4:我國(guó)第七次人口普查產(chǎn)生的數(shù)據(jù)屬于大數(shù)據(jù)嗎?我國(guó)每十年開展一次人口普查,統(tǒng)計(jì)全國(guó)各地人口的數(shù)量、年齡、性別、職業(yè)、受教育程度、住房情況等。2020年第七次人口普查的對(duì)象超過(guò)14億人,動(dòng)用的普查工作人員超過(guò)700萬(wàn),全面采用電子化數(shù)據(jù)采集方式,最終形成了巨大的數(shù)字化普查數(shù)據(jù)。請(qǐng)結(jié)合大數(shù)據(jù)的特征分析:人口普查的數(shù)據(jù)算不算大數(shù)據(jù)?任務(wù)4:我國(guó)第七次人口普查產(chǎn)生的數(shù)據(jù)屬于大數(shù)據(jù)嗎?人口普據(jù)不是大數(shù)據(jù)!人口普查的特征 是否相符 大數(shù)據(jù)的特征普查的對(duì)象超過(guò)14億人 √ 數(shù)據(jù)量大產(chǎn)生的速度相對(duì)較慢 × 產(chǎn)生速度快數(shù)據(jù)類型少 × 數(shù)據(jù)類型多數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)單 × 數(shù)據(jù)結(jié)構(gòu)復(fù)雜準(zhǔn)確性非常高 × 價(jià)值密度低用傳統(tǒng)方法即可分析和處理 × 無(wú)法用傳統(tǒng)方法處理動(dòng)用的工作人員超過(guò)700萬(wàn) × 通常由機(jī)器自動(dòng)產(chǎn)生人口普查的數(shù)據(jù)不是大數(shù)據(jù)!大數(shù)據(jù)對(duì)日常生活的影響使人們的日常生活更為便捷1.方便支付2.方便出行3.方便購(gòu)物4.方便醫(yī)療5.更精準(zhǔn)的產(chǎn)品推介我們?yōu)g覽網(wǎng)頁(yè)時(shí)跳出來(lái)的商品廣告,有些正與你的購(gòu)物需求匹配。精準(zhǔn)推介是如何實(shí)現(xiàn)的?第1步大數(shù)據(jù)給我們畫像第2步網(wǎng)站向商家發(fā)出投放廣告的競(jìng)價(jià)邀約第3步商家競(jìng)價(jià)第4步廣告投放大數(shù)據(jù)對(duì)日常生活的影響對(duì)人們?nèi)粘I町a(chǎn)生負(fù)面影響1.個(gè)人信息泄露2.信息傷害與詐騙2021年11月1日起,《中華人民共和國(guó)個(gè)人信息保護(hù)法》開始實(shí)施。不得過(guò)度收集個(gè)人信息不得非法買賣、提供或者公開他人信息不得進(jìn)行“大數(shù)據(jù)殺熟”在公共場(chǎng)所安裝圖像采集等設(shè)備應(yīng)設(shè)置顯著提示標(biāo)識(shí)……請(qǐng)同學(xué)們自主總結(jié)本節(jié)課內(nèi)容,并畫出思維導(dǎo)圖。課堂小結(jié)思維導(dǎo)圖自我評(píng)價(jià)請(qǐng)對(duì)照本節(jié)課的學(xué)習(xí)目標(biāo),對(duì)目標(biāo)達(dá)成情況進(jìn)行自我評(píng)價(jià)。學(xué) 習(xí) 目 標(biāo) 目標(biāo)達(dá)成情況 (達(dá)成/基本達(dá)成/未達(dá)成) 對(duì)未達(dá)成目標(biāo)的跟進(jìn)措施了解大數(shù)據(jù)的概念理解大數(shù)據(jù)的特征明晰傳統(tǒng)數(shù)據(jù)與大數(shù)據(jù)的區(qū)別知道大數(shù)據(jù)對(duì)日常生活的影響能有意識(shí)地規(guī)避大數(shù)據(jù)帶來(lái)的安全隱患課后作業(yè)作業(yè)1:閱讀大數(shù)據(jù)時(shí)代的開山之作、英國(guó)作家維克托 邁爾 舍恩伯格的《大數(shù)據(jù)時(shí)代》,更全面深入的了解大數(shù)據(jù),寫出至少三點(diǎn)閱讀感悟并分享到網(wǎng)絡(luò)空間中。作業(yè)2:每個(gè)人是大數(shù)據(jù)的受益者和使用者,也是大數(shù)據(jù)的提供者和來(lái)源。用戶的個(gè)人信息在用戶不知情、未授權(quán)的情況下被大公司收集、分析并用來(lái)盈利,是否合理?若你認(rèn)為不合理,請(qǐng)?zhí)岢龈倪M(jìn)建議。 展開更多...... 收起↑ 資源預(yù)覽 縮略圖、資源來(lái)源于二一教育資源庫(kù)