中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

3.3數(shù)據(jù)分析與可視化訓練4(含答案)

資源下載
  1. 二一教育資源

3.3數(shù)據(jù)分析與可視化訓練4(含答案)

資源簡介

3.3數(shù)據(jù)分析與可視化訓練4
學校:___________姓名:___________班級:___________考號:___________
一、選擇題
1.新冠肺炎疫情期間為了減少感染風險,在外出前可以提前通過電子地圖軟件查看人流情況。如圖,是某區(qū)域?qū)崟r人流密度圖,其圖形為數(shù)據(jù)可視化圖形中的( )
A.雷達圖 B.熱力圖 C.散點圖 D.詞云
2.數(shù)據(jù)如下圖所示,現(xiàn)在要對其整理,以下說法正確的是( )
A.第3行和第4行的數(shù)據(jù)完全一樣,可以用dropna()來刪除重復記錄
B.第6行中的溫度38.2可能是異常值,一般使用箱形圖或散點圖能清晰地觀察到異常值的存在
C.第6行中的溫度38.2可能是異常值,可以用前后兩條記錄中溫度的平均值修正該異常值
D.第7行有缺失值,在不研究濕度和風速的情況下,可以保留這條記錄
3.小申認為,除了溫度會影響騎行人數(shù),在學校附近的共享單車站點,工作日和節(jié)假日可能也會影響騎行人數(shù),于是他分別統(tǒng)計了工作日和節(jié)假日的騎行人數(shù),以下比較合理的操作是( )
A.分析工作日、節(jié)假日騎行人數(shù)的總和
B.分析工作日、節(jié)假日騎行人數(shù)的日平均數(shù)
C.分析工作日、節(jié)假日騎行人數(shù)的最大數(shù)
D.分析工作日、節(jié)假日騎行人數(shù)的最小數(shù)
4.以下不是數(shù)據(jù)分析的基本方法的是( )
A.對比分析法 B.平均分析法 C.結(jié)構(gòu)分析法 D.綜合分析法
5.如圖所示,某景區(qū)2020年某一周的入園游客數(shù)量圖表,根據(jù)圖表分析,下列結(jié)論錯誤的是( )
A.該圖表是折線圖 B.該圖表是雷達圖
C.周六的入園游客數(shù)量最 D.為了分散一周游客入園數(shù)量,可以在周三舉行門票打折活動
6.在分析《紅樓夢》時可以使用python將一些核心詞繪進行統(tǒng)計并生成詞云圖,從而挖掘出《紅樓夢》中更多的隱藏信息。詞云圖是一種數(shù)據(jù)可視化的表達方式,下列關(guān)于詞云圖的說法錯誤的是( )
A.詞云圖是目前常見的關(guān)鍵詞數(shù)據(jù)可視化表達的一種方式
B.可以通過詞云圖快速獲取文本數(shù)據(jù)中所蘊含的關(guān)鍵信息
C.可以通過詞云圖直觀呈現(xiàn)《紅樓夢》書中關(guān)鍵詞的出現(xiàn)頻次
D.詞云圖只能通過字體的大小表示關(guān)鍵詞的重要程度
7.研究某網(wǎng)絡購物平臺的歷史交易記錄,發(fā)現(xiàn)買商品A的人購買商品B的概率很大,這是應用了( )數(shù)據(jù)分析方法。
A.聚類分析 B.數(shù)據(jù)分類 C.回歸分析 D.關(guān)聯(lián)分析
8.數(shù)據(jù)分析的一般過程不包括( )
A.收集數(shù)據(jù) B.選擇恰當?shù)姆治龇椒ㄟM行分析
C.驗證假設是否正確 D.根據(jù)分析的目標提出假設
9.對于某個星球綜合能力常用如下類似的圖標進行標識,該類圖表是( )
A.折線圖 B.散點圖 C.雷達圖 D.柱形圖
10.為了直觀展示政府工作報告高頻詞,最適合選用的可視化表達方式是( )
A.熱力圖 B.雷達圖 C.網(wǎng)絡圖 D.詞云
11.小北利用python中的jieba分詞模塊對“大數(shù)據(jù).txt”進行處理,創(chuàng)建了如圖所示的標簽云,下列說法正確的是( )
A.該中文分詞算法是基于規(guī)則的分詞方法
B.標簽云中必須顯示該文本中包含的全部詞語
C.從標簽云中可以推測,“數(shù)據(jù)”、“數(shù)據(jù)庫”等詞語是該文本的重點詞語
D.文本內(nèi)容是結(jié)構(gòu)化數(shù)據(jù),需要轉(zhuǎn)化才能被計算機處理
12.分析一年12個月內(nèi)每個月降水量在全年所占百分比時用( )最為恰當。
A.柱狀圖 B.折線圖 C.餅圖 D.雷達圖
13.中國睡眠研究會等機構(gòu)發(fā)布《2022中國國民健康睡眠白皮書》,下圖展示了報告中睡眠困擾頻率、睡眠困擾形式。圖中使用的數(shù)據(jù)可視化方式是( )
A.餅圖、柱形圖 B.氣泡圖、餅圖 C.餅圖、雷達圖 D.氣泡圖、雷達圖
14.某同學填報高考志愿時將自高三以來的模擬成績和高考成績及興趣愛好一并錄入某一模擬填報平臺中,該平臺會給出其報考省份的重點大學及其相關(guān)專業(yè)方向的建議。該平臺分析數(shù)據(jù)時可能沒有采用的分析法是( )
A.橫向?qū)Ρ?B.縱向?qū)Ρ?C.平均分析 D.情景分析
15.如果要比較一個同學一個學期每次月考的語文成績,分析其語文學習的情況,這種數(shù)據(jù)分析的方法屬于( )
A.橫向?qū)Ρ?B.縱向分析 C.平均分析 D.綜合分析
參考答案:
1.B
【詳解】本題考查數(shù)據(jù)可視化相關(guān)內(nèi)容。(1)雷達圖是一種可視化圖表,也被稱為蛛網(wǎng)圖、星形圖或極坐標圖,它以一個中心點為起點,從中心點向外延伸出多條射線,每條射線代表一個特定的變量或指標,每條射線上的點或線段表示該變量在不同維度上的取值或得分。(2)熱力圖是一種數(shù)據(jù)可視化技術(shù),用于展示大量數(shù)據(jù)集中的區(qū)域和變化趨勢。它通過使用顏色編碼來顯示數(shù)據(jù)點的密度和分布情況,幫助用戶發(fā)現(xiàn)數(shù)據(jù)中的模式和規(guī)律,熱力圖通常在二維平面上呈現(xiàn),其中橫軸和縱軸代表數(shù)據(jù)的兩個維度,例如時間和地理位置,每個數(shù)據(jù)點都被映射到對應的坐標位置,并使用不同的顏色來表示數(shù)據(jù)的密度或數(shù)值大小。(3)散點圖是一種統(tǒng)計圖表,用于展示兩個變量之間的關(guān)系,在散點圖中,因變量(通常位于Y軸)的值隨自變量(通常位于X軸)的值變化而變化,這些點在坐標系中的位置顯示了數(shù)據(jù)的相關(guān)性和分布關(guān)系,可以通過觀察這些點的分布模式來分析兩個變量之間是否存在線性或其他類型的函數(shù)關(guān)系。(4)詞云是一種數(shù)據(jù)可視化技術(shù),用于展示大量文本數(shù)據(jù)中的關(guān)鍵詞,詞云通過形成類似云的彩色圖形來突出文本中出現(xiàn)頻率較高的詞語,使人們可以直觀地了解文本的主題和重點,在詞云圖中,字體大小或顏色通常用來表示每個詞的重要性,其中出現(xiàn)頻率較高的詞語會被放大,而頻率較低的詞語則可能變小或消失。故本題答案是B選項。
2.B
【詳解】本題考查數(shù)據(jù)處理相關(guān)內(nèi)容。A選項,在Python中,dropna()是一個Pandas庫中的函數(shù),用于從數(shù)據(jù)框(DataFrame)中刪除包含缺失值(NaN)的行或列,它用于數(shù)據(jù)清洗和預處理階段,以便去除缺失值,使數(shù)據(jù)更加規(guī)整,選項說法錯誤。B選項,散點圖也叫X-Y圖,它將所有的數(shù)據(jù)以點的形式展現(xiàn)在直角坐標系上,以顯示變量之間的相互影響程度,點的位置由變量的數(shù)值決定,散點圖能夠展示數(shù)據(jù)的分布情況,通過觀察數(shù)據(jù)點的密集程度和分布形態(tài),推斷出數(shù)據(jù)的離散程度和集中程度,散點圖能幫助發(fā)現(xiàn)異常值或離群點,這些點在圖上會與其他點有明顯的偏離或不符合預期的位置,表示數(shù)據(jù)的異常情況或錯誤;箱形圖是一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計圖,因形狀如箱子而得名,在各種領域也經(jīng)常被使用,常見于品質(zhì)管理,快速識別異常值。選項正確。C選項,出現(xiàn)異常值,應進行刪除或修正,不能用前后兩條記錄中溫度的平均值修正該異常值,選項錯誤。D選項,在處理缺失數(shù)據(jù)時,我們可以選擇不同的重建方法,如刪除缺失數(shù)據(jù)、均值填補、插值法、回歸方法和機器學習方法,選項錯誤。故本題答案是B選項。
3.B
【詳解】本題考查的是數(shù)據(jù)分析。工作日、節(jié)假日的天數(shù)不一致,故不能采用騎行人數(shù)的總和,選項A錯誤。數(shù)據(jù)可能有些偶然性,故不能采用最大數(shù)、最小數(shù),選項CD錯誤。故本題應選B。
4.D
【詳解】本題考查數(shù)據(jù)分析相關(guān)內(nèi)容。常用的數(shù)據(jù)分析方法包括:對比分析法、結(jié)構(gòu)分析法、平均分析法、交叉分析法。對比分析法是將兩個或兩個以上的數(shù)據(jù)進行比較,對比有橫向和縱向兩種。平均分析法是運用計算平均數(shù)的方法反映總體在一定時間、地點等條件下某一數(shù)量特征的一般水平。結(jié)構(gòu)分析法是將各個部分與總體進行對比。故本題答案是D選項。
5.B
【詳解】本題考查數(shù)據(jù)可視化相關(guān)內(nèi)容。折線圖是一條彎折或平滑的線條,它通過連接數(shù)據(jù)點的線條來顯示趨勢和模式,可以顯示隨時間或其他連續(xù)變量而變化的數(shù)據(jù)趨勢。雷達圖是一種可視化圖表,也被稱為蛛網(wǎng)圖、星形圖或極坐標圖,它以一個中心點為起點,從中心點向外延伸出多條射線,每條射線代表一個特定的變量或指標,每條射線上的點或線段表示該變量在不同維度上的取值或得分。由圖可知,該圖采用折線圖來分析入園游客數(shù)量變化情況。ACD選項正確,B選項錯誤。故本題答案是B選項。
6.D
【詳解】本題考查數(shù)據(jù)可視化。詞云圖除了可以通過字體的大小表示關(guān)鍵詞的重要程度外,還可以通過顏色、字體樣式等方式來呈現(xiàn)關(guān)鍵詞的不同特征。故答案為:D。
7.D
【詳解】本題考查數(shù)據(jù)分析相關(guān)內(nèi)容。聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個分類的標準,聚類分析能夠從樣本數(shù)據(jù)出發(fā)、自動進行分類。數(shù)據(jù)分類是數(shù)據(jù)分析處理中最基本的方法,通常的做法是基于樣本數(shù)據(jù)先訓練構(gòu)建分類函數(shù)或者分類模型(也稱為分類器),該分類器具有將分類數(shù)據(jù)項映射到某一特點類別的功能。 回歸分析是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。關(guān)聯(lián)分析就是分析并發(fā)現(xiàn)存在于大量數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性,從而描述一個事物中某些屬性同時出現(xiàn)的規(guī)律和模式。發(fā)現(xiàn)買商品A的人購買商品B的概率很大,這種屬于數(shù)據(jù)的關(guān)聯(lián)分析。故本題答案是D選項。
8.A
【詳解】本題考查數(shù)據(jù)分析相關(guān)內(nèi)容。數(shù)據(jù)分析是指用適當?shù)慕y(tǒng)計分析方法對收集來的大量數(shù)據(jù)進行分析,將它們加以匯總和理解并消化,以求最大化地開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)分析是為了提取有用信息和形成結(jié)論而對數(shù)據(jù)加以詳細研究和概括總結(jié)的過程。數(shù)據(jù)分析的過程包括首先要根據(jù)分析的目標提出假設,然后選擇恰當?shù)姆治龇椒ㄟM行分析,驗證假設是否正確。A選項不屬于數(shù)據(jù)分析的一般過程。故本題答案是A選項。
9.C
【詳解】本題主要考查圖表的應用。雷達圖也稱為網(wǎng)絡圖、蜘蛛圖、星圖、蜘蛛網(wǎng)圖,它被認為是一種表現(xiàn)多維數(shù)據(jù)的圖表。由圖可知,該類圖表是雷達圖,故本題選C選項。
10.D
【詳解】本題考查數(shù)據(jù)可視化相關(guān)內(nèi)容。(1)熱力圖是一種用顏色表達數(shù)據(jù)密度的可視化工具。它將數(shù)據(jù)以不同顏色的熱點形式呈現(xiàn)在二維空間中,用于展示數(shù)據(jù)的分布情況和集中程度,從而幫助我們觀察數(shù)據(jù)的趨勢和模式。(2)雷達圖是一種常見的數(shù)據(jù)可視化圖表,它的特點是利用多邊形的邊和頂點來表示多個變量或維度的數(shù)據(jù),在雷達圖中,每個變量或維度對應一個軸,而數(shù)據(jù)值則是通過對距離中心的測量來表示的。(3)網(wǎng)絡圖是一種圖解模型,形狀如同網(wǎng)絡,故稱為網(wǎng)絡圖。網(wǎng)絡圖是由作業(yè)(箭線)、事件(又稱節(jié)點)和路線三個因素組成的,在工程管理中,經(jīng)常使用到網(wǎng)絡圖的概念,網(wǎng)絡圖是用箭線和節(jié)點將某項工作的流程表示出來的圖形。(4)詞云又稱文字云,是文本數(shù)據(jù)的視覺表示,由詞匯組成類似云的彩色圖形,用于展示大量文本數(shù)據(jù),每個詞的重要性以字體大小或顏色顯示,主要用來做文本內(nèi)容關(guān)鍵詞出現(xiàn)的頻率分析,適合文本內(nèi)容挖掘的可視化,詞云中出現(xiàn)頻率較高的詞會以較大的形式呈現(xiàn)出來,出現(xiàn)頻率較低的詞會以較小的形式呈現(xiàn),詞云的本質(zhì)是點圖,是在相應坐標點繪制具有特定樣式的文字的結(jié)果。為了直觀展示政府工作報告高頻詞,最適合選用的可視化表達方式是詞云。故本題答案是D選項。
11.C
【詳解】本題考查的是標簽云。jieba分詞綜合了基于字符串匹配的算法和基于統(tǒng)計的算法,選項A說法錯誤;標簽云中不需要顯示該文本中包含的全部詞語,選項B說法錯誤;從標簽云中可以推測,“數(shù)據(jù)”、“數(shù)據(jù)庫”等詞語是該文本的重點詞語,選項C說法正確;文本內(nèi)容是非結(jié)構(gòu)化數(shù)據(jù),故選項D說法錯誤。故本題應選C。
12.C
【詳解】本題考查圖表類型相關(guān)內(nèi)容。(1)柱狀圖是一種利用長方形的長短來表示數(shù)據(jù)的統(tǒng)計圖表,它通過垂直排列的長方形(條形)來顯示不同類別或組別的數(shù)據(jù)及其相對大小,從而便于比較和理解數(shù)據(jù)的分布和變化情況。(2)折線圖是將數(shù)據(jù)標注成點,并通過直線將這些點按某種順序連接而成的圖表,它以折線的方式形象地反映事物沿某個維度的變化趨勢,能夠清晰地展示數(shù)據(jù)增減的趨勢、速率、規(guī)律及峰值等特征。(3)餅圖是由若干個面積大小不一、以條形或顏色填的扇形組成的圓形圖表,它使用圓表示數(shù)據(jù)的總量,組成圓的每個扇形表示數(shù)據(jù)中各項占總量的比例大小,主要用于顯示數(shù)據(jù)中各項大小與各項總和的比例。(4)雷達圖是一種常見的數(shù)據(jù)可視化圖表,它的特點是利用多邊形的邊和頂點來表示多個變量或維度的數(shù)據(jù)。在雷達圖中,每個變量或維度對應一個軸,而數(shù)據(jù)值則是通過對距離中心的測量來表示的。這種圖表能夠清晰地展示不同變量之間的差異和相對位置,有助于理解數(shù)據(jù)的分布和模式。
分析一年12個月內(nèi)每個月降水量在全年所占百分比時用餅圖來展現(xiàn)最為恰當。故本題答案是C選項。
13.C
【詳解】本題考查數(shù)據(jù)可視化方式。根據(jù)題干提到的報告中睡眠困擾頻率和睡眠困擾形式的圖表,可知使用了餅圖、雷達圖。這意味著報告采用了餅圖來展示睡眠困擾頻率的分布情況,同時使用雷達圖呈現(xiàn)不同睡眠困擾形式的特征。這種組合可以提供對數(shù)據(jù)的全面了解。故答案為:C。
14.D
【詳解】本題考查數(shù)據(jù)分析相關(guān)內(nèi)容。橫向?qū)Ρ仁侵笇⑼活悇e或同一對象的不同事物或概念進行比較。橫向?qū)Ρ鹊哪康氖菑亩鄠€角度考察不同事物的差異和相似之處,幫助人們更好地理解事物。縱向?qū)Ρ仁侵笇⑼皇挛镌诓煌瑫r間或不同條件下進行比較,縱向?qū)Ρ鹊哪康氖欠治鍪挛锏陌l(fā)展變化、趨勢和演化過程,揭示事物的內(nèi)在規(guī)律。平均分析法是指運用計算平均數(shù)的方法來反映總體在一定時間、地點條件下某一數(shù)量特征的一般水平的分析方法。情景分析法又稱腳本法或者前景描述法,是假定某種現(xiàn)象或某種趨勢將持續(xù)到未來的前提下,對預測對象可能出現(xiàn)的情況或引起的后果作出預測的方法,通常用來對預測對象的未來發(fā)展作出種種設想或預計,是一種直觀的定性預測方法。題目內(nèi)容中采用了橫向?qū)Ρ取⒖v向?qū)Ρ群推骄治觯⑽床捎们榫胺治龇ā9时绢}答案是D選項。
15.B
【詳解】本題考查數(shù)據(jù)分析方法。縱向分析是比較同一個對象在不同時間點上的數(shù)據(jù),即縱向比較同一個同學每次月考的語文成績,以分析其學習的變化趨勢,因此是本題的正確答案。故答案為:B。

展開更多......

收起↑

資源預覽

<pre id="tfb94"><li id="tfb94"></li></pre>

<bdo id="tfb94"><rt id="tfb94"></rt></bdo>
  • <menu id="tfb94"><dl id="tfb94"></dl></menu><i id="tfb94"><acronym id="tfb94"><sub id="tfb94"></sub></acronym></i>

    1. 主站蜘蛛池模板: 万州区| 汨罗市| 赞皇县| 三门峡市| 沁源县| 尉氏县| 琼海市| 双江| 巨鹿县| 昭通市| 嘉禾县| 蚌埠市| 连山| 和政县| 黄冈市| 织金县| 梧州市| 东宁县| 武隆县| 柘荣县| 陆川县| 临潭县| 崇礼县| 新丰县| 阳朔县| 加查县| 陇西县| 房山区| 历史| 新巴尔虎右旗| 桃园县| 隆林| 阳西县| 通榆县| 栖霞市| 昌宁县| 鄯善县| 曲阳县| 汝城县| 双桥区| 昭觉县|