資源簡介 1.5 數據與大數據一、選擇題1.百度根據用戶的瀏覽記錄,推斷用戶的愛好并推送相應的信息,這些信息包含有百度百科、網頁、圖像、音視頻等數據。從互聯網產生大數據的角度看,這一應用突出了大數據特征( )A.數據類型繁多 B.數據生成速度快 C.數據體量巨大 D.數據價值密度低2.一家大型零售公司長期以來一直依賴傳統的市場調查和經驗來進行商品定價和庫存管理。然而,隨著大數據技術的興起,公司開始收集并分析大量的消費者購物行為數據,以更精確地了解消費者的需求和購買決策過程。大數據改變的不僅是數據,還有人們的思維。針對此,以下描述正確的是( )A.大數據強調對事物因果關系的分析 B.大數據不接受數據的混雜性C.大數據分析的是抽樣數據 D.大數據更加注重事物的相關性3.下列行為可能使用大數據的是( )。①為了避免堵車,利用高德地圖,查看道路擁堵情況 ②利用人臉識別打開門禁道閘,進入校園③水銀溫度計上顯示當前氣溫是30℃ ④全民K歌提示你打敗了全國90%的人⑤微信運動顯示你今天走了10000步A.①②③④ B.①②④⑤ C.②③④⑤ D.①②③④⑤4.海南自貿港物流監管服務系統采用大數據技術,以道路、水路、鐵路、航空運輸等信 息資源共享為基礎, 整合接入了交通部、海關、鐵路公司等 42 個單位的 62 個系統數據, 采集了海口、三亞、洋浦等16個碼頭的物流數據和監控視頻,最終形成進出島物流數據資源庫,為自貿港物流的正常運營提供強有力的服務。下列關于大數據技術的說法,不正確的是( )。A.由 42 個單位 62 個系統產生的數據體量巨大, 體現了大數據的巨量性B.龐大的數據量中可能產生價值的只是其中非常小的部分,說明該系統應用價值不高C.該系統中的物流數據和監控視頻等包含的數據種類繁多,體現了大數據的多樣性D.該系統能在很短的時間內處理大最的數據, 體現了大數據存取速度快的特點5.請描述大數據的五個主要特征,并簡要說明每個特征的含義。6.下列有關“電商客服機器人”的說法,正確的是( )A.客戶的文本語料屬于非結構化數據B.商品銷售比例圖適合采用環形圖C.基于規則的中文分詞方法已在實際應用中廣泛使用D.客服機器人可采用批處理計算處理數據反饋來實時調整推薦商品7.關于大數據和大數據處理,下列說法不正確的是( )A.大數據的特征是數據量大、速度快、數據類型多、價值密度低B.大數據分析的是抽樣數據,讓決策更精準C.處理大數據時一般采用分治思想D.道路交通中實時產生的數據屬于流數據8.火車作為中國交通運輸的動脈,每年僅春運就承擔了約10億人次的運輸。在互聯網和移動終端普及的今天,通過網絡購票成為了最佳選擇。系統通過大數據技術,對購票的實時數據進行合理分析,精準調配列車運行車次。下列關于大數據的說法,正確的是( )A.大數據就是數據量巨大的數據 B.大數據指數據量龐大、價值密度高的數據C.大數據應用不會泄露用戶隱私信息 D.大數據分析一般采用分治思想9.從互聯網思維的角度來看,大數據具有的特征是( )A.大量、多樣、低價值密度、高速B.分布式存儲、分布式并行計算C.樣本漸趨于總體,精確讓位于模糊,相關性重于因果D.確定性和時效性10.對近八年高考作文題的作文范文、歷年新聞熱點等數據進行深度挖掘分析,預測高考作文的命題方向。說明大數據具有以下哪項特點( )A.價值性 B.迅變性 C.單一性 D.傳遞性11.下列關于大數據的說法,正確的是( )A.大數據指數據量龐大、價值密度高的數據B.一般采用分治思想進行大數據分析C.系統可以使用批處理計算對購票的實時數據進行分析D.大數據應用不會泄露用戶隱私信息12.下列場景中沒有體現大數據技術應用的是( )A.朋友圈推送感興趣的廣告 B.金融機構對客戶進行信用評估C.手機導航給出假期出行路線建議 D.根據班級學生體質情況給出膳食意見13.12306網站于 2011年 6月 12日正式投入購票業務,在北京、上海、廣州、武漢、西安、沈陽等多地設置了服務器,為社會提供車票發售、列車時刻查詢等服務,近日訪問量達到了 532億次。在春運期間,12306根據以往的出行數據,預測客流趨勢,優化運力調配,制定多項決策,以更好滿足旅客的需求。下列關于大數據的說法正確的是( )A.使用批處理計算實時分析用戶行為B.12306網站中歷年旅客流動數據屬于流數據C.需要分析旅客出行的原因以做出更準確的客流趨勢預測D.可以利用以往的出行大數據制定優化決策,說明大數據的價值高14.利用大數據預測人流密集、監測疫情動向,一鍵上報疫情檢查情況,實時生成疫情報告數據等進行疫情防控,下列沒有用到大數據技術的是( )A.用戶利用“城市熱力圖”等提供的信息,避開人流密度高的地區B.繪制確診病人入院前的行動軌跡,查找與之密切接觸人員的去向C.在超市、銀行等公共場所,用手持測溫儀測量人員的體溫數據D.相關機構實時采集各地的數據,進行每天的疫情信息發布15.下列關于數據、信息、知識以及大數據相關說法不正確的是( )A.中國大量古代典籍已消失在歷史長河中,說明信息具有載體依附性B.信息是數據經過存儲、分析及解釋后所產生的意義C.智慧是在知識的基礎上,形成對事物的遠見D.大數據分析時,要確保每個樣本準確,以便探求事物因果關系16.下列有關大數據的說法,不正確的是( )A.大數據要分析的是抽樣數據,而不是全體數據B.大數據的速度快不僅指數據產生的速度快,還指數據處理的速度快C.大數據不再追求個別數據的精確性,允許數據混雜D.大數據價值密度的高低與數據總量的大小成反比二、填空題17.從互聯網產生的大數據角度看,其最顯著特征是 。18.用軟件聊天、攝像頭監控時,每天都會產生海量數據,這突出體現了大數據產生速度快、體量 、類型多、價值密度低的特征。19.某地智慧交通平臺每天獲取交通卡刷卡記錄1900萬條,手機定位數據1800萬條,這種無法在可承受時間用常規軟件工具進行處理的數據,被稱為 。20.大數據是以 大、 多、 快、 高為主要特征的數據集合,它正快速發展為對數量巨大、來源分散、格式多樣的數據進行 、 和 ,從中發現新知識,創造新價值、提升新能力的新一代信息技術和服務業態。三、判斷題21.大數據的特征包括數據量大、處理速度快、數據類型單一和價值密度高。( )22.POI(Point of Interest)可以翻譯成“興趣點”,也稱為“信息點”。( )23.大數據是指大量的數據。( )24.大數據的最顯著特征是數據處理速度快。( )25.大數據是指無法在可承受的時間范圍內用常規軟件工具進行高效捕捉、管理和處理的數據集合。是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產( )參考答案:1.A【詳解】本題主要考查大數據的特征。大數據的特征有:數據類型繁多、 數據生成速度快、 數據體量巨大、 數據價值密度低。由題干“這些信息包含有百度百科、網頁、圖像、音視頻等數據”,可知這一應用突出了大數據特征數據類型繁多,故本題選A選項。2.D【詳解】本題考查大數據相關內容。大數據分析的是全體數據,更加注重事物的相關性,而不是強調對事物因果關系的探究, 能夠接受數據的混雜性。ABC選項說法錯誤,D選項說法正確。故本題答案是D選項。3.B【詳解】本題考查大數據相關知識點①②④⑤是從海量的數據范圍里進行分析,處理,得到結果的。③水銀溫度計上顯示當前氣溫是30℃,不涉及從很多數據中分析,沒有使用到大數據。故本題選B選項4.B【詳解】本題主要考查大數據技術。大數據具有價值密度低的特性,龐大的數據量中可能產生價值的只是其中非常小的部分,不能說明該系統應用價值不高,故本題選B選項。5.大數據的五個主要特征是體量(Volume)、多樣性(Variety)、速度(Velocity)、真實性(Veracity)和價值(Value)。體量指數據的規模;多樣性指數據類型的多樣性;速度指數據生成和處理的速度;真實性指數據的準確性和可信度;價值指數據中蘊含的有用信息和知識。【詳解】本題考查大數據特征。大數據的五個主要特征是體量(Volume)、多樣性(Variety)、速度(Velocity)、真實性(Veracity)和價值(Value)。體量指數據的規模,即數據量的大小;多樣性指數據類型的多樣性,包括結構化數據、半結構化數據和非結構化數據等不同類型;速度指數據生成和處理的速度,強調數據處理的實時性和即時性;真實性指數據的準確性和可信度,確保數據的來源可靠、完整和準確;價值指數據中蘊含的有用信息和知識,即通過分析和挖掘數據可以獲得的業務洞察和價值。6.A【詳解】本題考查大數據。B選項錯誤,商品銷售比例圖采用餅圖比較合適;C選項錯誤,基于規則的中文分詞方法目前還處于試驗階段;D選項錯誤,客服機器人可采用流計算處理數據反饋來實時調整推薦商品。故答案為:A。7.B【詳解】本題主要考查大數據和大數據處理。大數據的特征是數據量大、速度快、數據類型多、價值密度低;大數據分析的是全部數據;處理大數據時一般采用分治思想;道路交通中實時產生的數據屬于流數據,故本題選B選項。8.D【詳解】本題考查是大數據相關知識。大數據是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合,選項A說法錯誤;大數據價值密度低,選項B說法錯誤;大數據應用會泄露用戶隱私信息,選項C說法錯誤;大數據分析一般采用分治思想,選項D說法正確。故選D。9.C【詳解】本題考查大數據特征相關內容。大數據具有“4V”特征:大量(Volume)、多樣(Variety)、價值(Value)、高速(Velocity)。從互聯網思維的角度來看,大數據具有樣本漸趨于總體,精確讓位于模糊,相關性重于因果。從大數據存儲于計算的角度來看,大數據具有分布式存儲,分布式并行計算。故本題答案是C選項。10.A【詳解】本題考查的是大數據特點。對近八年高考作文題的作文范文、歷年新聞熱點等數據進行深度挖掘分析,預測高考作文的命題方向。說明大數據具有價值性。故選A。11.B【詳解】本題考查的是大數據的描述。大數據具有數據體量大、速度快、數據類型多、價值密度低的特點,A選項錯誤;靜態數據適合批處理,流數據適合實時計算,圖數據需要進行圖計算,C選項錯誤;大數據應用會泄露用戶隱私,D選項錯誤。故選B。12.D【詳解】本題考查的是大數據應用。大數據是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合。 大數據技術,是指從各種各樣類型的數據中,快速獲得有價值信息的能力。根據班級學生體質情況給出膳食意見沒有體現大數據技術應用。故本題應選D。13.D【詳解】本題考查大數據相關內容。A選項,批處理是指在特定時間跨度內批量處理大量數據;流處理是指在產生連續數據流時立即對其進行處理;實時分析用戶行為需要使用流處理來計算,選項錯誤。B選項,流數據一般指實時產生的數據流,例如傳感器數據、日志數據等;批數據一般指離線處理的數據,例如從數據庫中導出的數據、歷史數據等;12306網站中歷年旅客流動數據屬于批數據,選項錯誤。C選項,準確的客流趨勢預測只需要分析旅客的出行數據,不需要分析旅客出行的原因,選項錯誤。D選項,可以利用以往的出行大數據制定優化決策,說明大數據的價值高,選項正確。故本題答案是D選項。14.C【詳解】本題主要考查大數據的應用。繪制確診病人住院前的行動軌跡,查找與之密切接觸人員的去向;相關機構實時采集各地的數據,進行每天的疫情信息發布;用戶利用“城市熱力圖”等提供的信息,避開人流密度高的地區,均屬于大數據技術的應用,數據保存在后臺數據庫中。在超市、銀行等場所,用手持測溫儀測量入場人員的體溫數據,沒有用到大數據技術,故本題選C選項。15.D【詳解】本題考查的是大數據相關知識。從互聯網思維的角度來看,大數據具有三個特征:樣本漸趨于總體,精確讓位于模糊,相關性重于因果。故大數據分析時,并不要確保每個樣本準確。本題應選D。16.A【詳解】本題考查的是大數據特征。大數據的特征:(1)從互聯網產生大數據的角度來看,大數據具有“4V”特征:大量(Volume)、多樣(Variety)、低價值密度(Value)、高速(Velocity)(2)從互聯網思維的角度來看,大數據具有三個特征:樣本漸趨于總體,精確讓位于模糊,相關性重于因果。(3)從大數據存儲與計算的角度來看,大數據具有兩個特征:分布式存儲和分布式并行計算。故本題應選A。17.數據體量巨大【詳解】本題考查的是大數據特征。本題主要考查大數據的特征。從互聯網產生的大數據角度來看,大數據具有4V特征,分別是:大量、多樣、低價值密度、高速,其中最顯著特征是數據體量巨大。18.大/巨大【詳解】本題主要考查大數據的特征。用軟件聊天、攝像頭監控時,每天都會產生海量數據,這突出體現了大數據產生速度快、體量大、類型多、價值密度低的特征。19.大數據【詳解】本題主要考查大數據的概念。大數據是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合。 大數據技術,是指從各種各樣類型的數據中,快速獲得有價值信息的能力。 適用于大數據的技術,包括大規模并行處理(MPP)數據庫,數據挖掘電網,分布式文件系統,分布式數據庫,云計算平臺,互聯網,和可擴展的存儲系統。20. 容量 類型 存取速度 應用價值 采集 存儲 關聯分析【詳解】本題考查的是大數據相關知識。大數據是以容量大、類型多、存取速度快、應用價值高為主要特征的數據集合,它正快速發展為對數量巨大、來源分散、格式多樣的數據進行采集、存儲和關聯分析,從中發現新知識,創造新價值、提升新能力的新一代信息技術和服務業態。21.錯誤【詳解】本題考查大數據特征。大數據的特征之一是數據類型的多樣性(Variety),而不是單一性;同時,由于大數據中包含了大量的信息,但真正有價值的信息可能只占據很小的一部分,因此價值密度相對較低(Value),而不是高。綜上所述,大數據的主要特征包括數據量大、處理速度快、數據類型多樣和價值密度低。這些特征使得大數據處理和分析需要采用新的技術和方法,以應對其帶來的挑戰和機遇。故題干說法錯誤。22.正確【詳解】本題考查POI的概念。POI是Point of Interest的縮寫,可以翻譯成“興趣點”,也稱為“信息點”。故說法正確。23.錯誤【詳解】本題考查大數據的概念。大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。故表述錯誤。24.錯誤【詳解】本題主要考查大數據的特征。大數據的最顯著特征是數據規模大,故表述錯誤。25.正確【詳解】本題主要考查大數據的描述。大數據是指無法在可承受的時間范圍內用常規軟件工具進行高效捕捉、管理和處理的數據集合。是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產,表述正確。 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫