資源簡介 (共23張PPT)粵教版普通高中教科書信息技術 必修15.1 認識大數據靈璧縣第二中學 王鳳龍身邊的大數據場景一:當我們打開淘寶、拼多多等購物軟件時,首頁會顯示出推薦的商品。為什么購物軟件推薦的商品總是很合我們心意?場景二:當我們打開抖音、嗶哩嗶哩等視頻軟件時,首頁會顯示出推薦的視頻。為什么打開視頻軟件就刷到停不下來了?大數據分析播放時長點贊視頻類型評論教育程度性別年齡地域職業搜索記錄用戶觀看視頻行為分析用戶網絡購物行為分析學習內容大數據的基本概念大數據是指無法在可承受的時間范圍內用常規軟件工具進行高效捕捉、管理和處理的數據集合。常規數據處理軟件工具數據量 <100萬條PythonR語言HadoopSparkExcleWps大數據處理軟件工具數據量 >100萬條……大數據的產生和意義大數據的產生是與人類日益普及的網絡行為所伴生的。互聯網生成的數據量,不僅遠超此前一切人類所生成的數據量的總和,而且在以大爆發性的速度不斷增長。在天氣預報、大氣監測、地球物理探礦和天體運動觀測等科學實驗和科學觀察等活動中,各種各樣的傳感器每時每刻都在產生大量的數據。大數據已成為人們提取信息、做出決策的重要依據,是推動信息社會發展的重要資源。交通大數據購物大數據新冠肺炎大數據氣象大數據大數據的特征案例1:某市交通智能化分析平臺的數據來源于道路交通、電信、地理信息系統等各行各業。例如,交通卡刷卡每天產生1900萬條記錄,手機定位數據每天產生1800萬條,出租車運營數據每天產生100萬條,電子停車收費系統數據每天產生50萬條,等等。這些數據在體量和速度上都達到了大數據的規模。大數據的特征結合書本案例1,從互聯網產生大數據的角度來看大數據具有哪些特征?數據體量巨大:從TB級別躍升到PB級別。(1024GB=1TB,1024TB=1PB)1PB約相當于1024*200個王者榮耀1PB約相當于1024*50個原神5GB20GB案例1:某市交通智能化分析平臺的數據來源于道路交通、電信、地理信息系統等各行各業。例如,交通卡刷卡每天產生1900萬條記錄,手機定位數據每天產生1800萬條,出租車運營數據每天產生100萬條,電子停車收費系統數據每天產生50萬條,等等。這些數據在體量和速度上都達到了大數據的規模。大數據的特征 - 從互聯網產生大數據的角度來看結合書本案例1,從互聯網產生大數據的角度分析大數據具有哪些特征?數據類型繁多:如網絡日志、視頻、圖片、地理位置信息等淘寶小紅書案例1:某市交通智能化分析平臺的數據來源于道路交通、電信、地理信息系統等各行各業。例如,交通卡刷卡每天產生1900萬條記錄,手機定位數據每天產生1800萬條,出租車運營數據每天產生100萬條,電子停車收費系統數據每天產生50萬條,等等。這些數據在體量和速度上都達到了大數據的規模。大數據的特征結合書本案例1,從互聯網產生大數據的角度分析大數據具有哪些特征?數據價值密度低:大數據的數據量很多,但其中有價值的數據卻相對占比較少。以視頻為例,在連續不間斷的監控過程中,有用的數據可能僅僅一兩秒。警察利用監控視頻破案案例1:某市交通智能化分析平臺的數據來源于道路交通、電信、地理信息系統等各行各業。例如,交通卡刷卡每天產生1900萬條記錄,手機定位數據每天產生1800萬條,出租車運營數據每天產生100萬條,電子停車收費系統數據每天產生50萬條,等等。這些數據在體量和速度上都達到了大數據的規模。大數據的特征結合書本案例1,從互聯網產生大數據的角度分析大數據具有哪些特征?數據變化速度快:數據來自世界各地的網絡終端,且以秒為單位快速變化。互聯網加快了數據產生和變化的速度……各類互聯網平臺每天都產生大量的數據大數據的特征案例2:搜索引擎公司通過跟蹤網民對“感冒癥狀”以及“治療”等關鍵詞的搜索,發現某個時段在某個區域內搜索數量急劇增長,從而成功預測了甲型H1N1流感的暴發時間、地域。結合書本案例2,從互聯網思維的角度來看大數據具有哪些特征?1. 樣本漸趨于總體:在大數據時代強調數據要全量而不是抽樣,即強調數據規模全量,而不是強調數量巨大。大數據時代有了更好的數據采集手段,讓獲取全量數據成為可能。電子問卷、面向所有人、各種聯網信息系統數據全面,省時省力現在采集數據紙質問卷、抽取樣本、人工整理和分析數據數據不全,耗時耗力以前采集數據大數據的特征 - 從互聯網思維的角度來看案例2:搜索引擎公司通過跟蹤網民對“感冒癥狀”以及“治療”等關鍵詞的搜索,發現某個時段在某個區域內搜索數量急劇增長,從而成功預測了甲型H1N1流感的暴發時間、地域。2. 精確讓位于模糊:大數據時代研究的數據如此之多,追求的不是精確性,而是模糊性。在大數據時代,只要掌握了大體的發展方向即可,適當忽略微觀層面上的精確度,會讓我們在宏觀層面擁有更好的洞察力。整體上升整體滿意大數據的特征 - 從互聯網思維的角度來看案例2:搜索引擎公司通過跟蹤網民對“感冒癥狀”以及“治療”等關鍵詞的搜索,發現某個時段在某個區域內搜索數量急劇增長,從而成功預測了甲型H1N1流感的暴發時間、地域。3. 相關性重于因果:大數據時代不是因果關系,而是相關關系。在大數據時代,無須再緊盯事物之間的因果關系,而應該尋找事物之間的相關關系;相關關系也許不能準確地告訴我們某件事情為何會發生,但是會提醒我們這件事情正在發生。甲型H1N1流感的爆發時間、地域某個時段在某個區域內搜索數量結果數據數據與結果之間直接存在相關關系,但不存在因果關系相關關系是指A變時B也變,A與B之間存在一定的聯系,但A變并不是導致B變的原因。因果關系是指A變時B也變,并且A變是導致B變的原因。例如:天氣逐漸變冷后,戴口罩的人員數量越來越多,感冒的人員數量也越來越多。大數據的特征 - 大數據存儲與計算的角度來看案例3:目前,某基于大數據的網約車平臺已覆蓋全國400多個城市,涵蓋出租車、快車、順風車、代駕、專車、試駕以及租車等多項業務,為人們的出行帶來極大的便利。我們只需在網約車APP上輸入或者說出目的地,強大的智能系統就立刻分配訂單,即時通知附近司機;借助定時定位系統,我們可以看到司機的大致位置以及預計到達時間。結合書本案例3,從大數據存儲與計算的角度來看大數據具有哪些特征?分布式處理:將不同地點的,或具有不同功能的,或擁有不同數據的多臺計算機,通過網絡連接起來,在控制系統的統一管理控制下,協調地完成大規模信息處理任務的計算機系統。包括分布式存儲和分布式并行計算。海量數據計算任務……分散存儲任務分解多臺計算機1、下列關于大數據的特征,說法正確的是 ( )?A. 數據價值密度高B. 數據類型少C. 數據基本無變化D. 數據體量巨大真題練習D2、下列關于大數據的特征,說法錯誤的是 ( )?A. 大數據是對抽樣數據進行分析B. 大數據追求絕對的精確,不能容忍任何錯誤C. 大數據分析的是全體數據D. 大數據強調對事物因果關系的探求,不注重它們的相關性C3、 ( )技術是指把一個復雜的計算任務分解成若干子任務在一個分布式的系統中進行并行計算,最終得到結果并合并輸出,從而實現高效率的計算 ?A. 分布式存儲B. 分布式并行計算C. 物聯網D. 人工智能B4、以視頻為例,在連續不間斷的監控過程中,有用的數據可能僅僅一兩秒,這是大數據 ( )特征的體現?5、大數據就是指數據體量很大的數據。 ( )?A. 正確B. 錯誤真題練習C6、大數據的來源只能是人工產生的。 ( )?A. 正確B. 錯誤BA. 數據體量巨大B. 數據類型繁多C. 數據價值密度低D. 數據變化速度快B討論大數據對生活的影響?1、方便支付。中國是全球最大的移動支付市場。醫院、餐廳、菜市場、加油站,甚至路邊攤,都在使用移動支付。中國人今天的生活,已經越來越有科技含量。大數據使人們日常生活更加便捷2、方便出行。應用交通系統的大數據,網絡約車出行,智能導航行車避免堵車,無人駕駛,智能地圖方便尋路,等等。3、方便購物與產品推介。網絡購物不但節省人們出行購物的時間,而且幫助企業有效判斷用戶的信息需求和消費需求,對客戶進行產品推介,方便人們選購產品。大數據使人們日常生活更加便捷4、方便看病與診病。應用網絡預約掛號,減輕與節省患者排隊掛號看病的辛勞與時間;同時,又方便醫生提前分析患者的病史數據,以便更科學診病。……淘寶抖音電商拼多多京東除此之外,大數據還對食品、教育、金融、政府管理、城市建設、環境保護等領域都產生了積極的影響,這里就不再做詳細展開。1、個人信息泄露。在大數據時代,我們使用的手機、計算機、網絡、信用卡等信息科技,都會產生數據。這些數據時刻存在泄露的風險。大數據對人們日常產生的負面影響2、信息傷害與詐騙。在大數據時代,我們的網絡信息隨時都可能被不法分子竊取,并對我們及身邊的親人造成傷害。大數據的濫用 → “大數據殺熟”智能推薦的負面影響 → “信息繭房”真題練習1、下列關于大數據的說法,錯誤的是 ( )?A. 大數據使人們的生活更加便捷的同時也會帶來了一些安全隱患B. 大數據已成為人們提取信息、做出決策的重要依據C. 大數據的應用降低了用戶隱私泄露的風險D. 大數據是指無法在可承受的時間范圍內用常規軟件工具進行高效捕捉、管理和處理的數據集合C總結作業課后通過觀察身邊或者上網檢索看看現實生活中還有些應用大數據的案例。第二章 知識與數字化學習 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫