中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

2025普通高中信息技術(shù)學(xué)業(yè)水平考試專(zhuān)題練--優(yōu)化集訓(xùn)11 pandas數(shù)據(jù)處理

資源下載
  1. 二一教育資源

2025普通高中信息技術(shù)學(xué)業(yè)水平考試專(zhuān)題練--優(yōu)化集訓(xùn)11 pandas數(shù)據(jù)處理

資源簡(jiǎn)介

中小學(xué)教育資源及組卷應(yīng)用平臺(tái)
2025普通高中信息技術(shù)學(xué)業(yè)水平考試
優(yōu)化集訓(xùn)11 pandas數(shù)據(jù)處理
1.下列關(guān)于數(shù)據(jù)的說(shuō)法錯(cuò)誤的是(  )
A.數(shù)據(jù)整理的目的是對(duì)數(shù)據(jù)進(jìn)行檢測(cè)和修正
B.數(shù)據(jù)處理的核心是數(shù)據(jù),數(shù)據(jù)的質(zhì)量不影響數(shù)據(jù)分析的結(jié)果
C.數(shù)據(jù)重復(fù)往往在多數(shù)據(jù)源進(jìn)行合并時(shí)出現(xiàn)
D.不同格式的數(shù)據(jù)通過(guò)轉(zhuǎn)換可以將其值按照統(tǒng)一標(biāo)準(zhǔn)進(jìn)行表示
2.下列有關(guān)Hadoop計(jì)算平臺(tái)的說(shuō)法中,不正確的是 (  )
A.Hadoop計(jì)算平臺(tái)是一個(gè)可運(yùn)行于規(guī)模計(jì)算機(jī)集群上的分布式系統(tǒng)基礎(chǔ)架構(gòu)
B.Hadoop計(jì)算平臺(tái)適用于對(duì)靜態(tài)數(shù)據(jù)進(jìn)行處理
C.Hadoop計(jì)算平臺(tái)主要包括Common公共庫(kù)、HDFS、HBase、MapReduce等模塊
D.Hadoop計(jì)算平臺(tái)也適用于對(duì)流數(shù)據(jù)的實(shí)時(shí)處理
3.下列數(shù)據(jù)不適合運(yùn)用批處理計(jì)算的是(  )
A.全校上一次考試的成績(jī)統(tǒng)計(jì)
B.微博上一季的熱詞統(tǒng)計(jì)
C.根據(jù)路況實(shí)時(shí)更新導(dǎo)航路線
D.某商品價(jià)格過(guò)去一年的浮動(dòng)情況
4.不能實(shí)現(xiàn)選取df對(duì)象前5行數(shù)據(jù)記錄的語(yǔ)句是(  )
A.df.head() B.df.head(5)
C.df[0:5] D.df[5]
回答下列第5~7題。
5.某DataFrame對(duì)象df中包含“準(zhǔn)考證號(hào)”“班級(jí)”“姓名”“文”“數(shù)學(xué)”…“總分”等10個(gè)數(shù)據(jù)列、多個(gè)數(shù)據(jù)行,能獲取對(duì)象df第3個(gè)數(shù)據(jù)的“姓名”內(nèi)容的語(yǔ)句有(  )
①df[2,'姓名'] ②df.at[2,'姓名'] ③df[2]['姓名'] ④df['姓名'][2] ⑤df.姓名[2]
A.①②③ B.①②④
C.②④ D.②④⑤
6.如第5題對(duì)象df,能夠降序排列輸出總分大于等于600分的學(xué)生數(shù)據(jù)的代碼組合是(  )
①df=df.sort_values(″總分″,ascending=True)
②df=df.sort_values(″總分″,ascending=False)
③df=df[″總分″,>=600]
④df=df[df[″總分″]>=600]
⑤print(df)
A.①③⑤ B.①④⑤
C.②③⑤ D.②④⑤
7.如第5題對(duì)象df1,下列語(yǔ)句中,可以以班級(jí)為單位,統(tǒng)計(jì)出各班級(jí)“總分”的平均值的有(  )
①df.groupby('班級(jí)').mean()
②df.groupby('總分').mean()
③df.groupby('班級(jí)')['總分'].mean()
④df.groupby('班級(jí)').總分.mean()
⑤df.groupby('班級(jí)').describe()
A.①②③④⑤ B.①②③⑤
C.①③④⑤ D.①②③
8.根據(jù)交通路況實(shí)時(shí)更新導(dǎo)航線路的應(yīng)用場(chǎng)景中,下列處理方式中合理的是(  )
A.選用針對(duì)靜態(tài)數(shù)據(jù)的批處理計(jì)算
B.選用針對(duì)流數(shù)據(jù)的流計(jì)算
C.選用針對(duì)圖結(jié)構(gòu)數(shù)據(jù)的圖計(jì)算
D.用統(tǒng)計(jì)分析軟件提供的豐富的統(tǒng)計(jì)算法進(jìn)行數(shù)據(jù)分析
9.下列有關(guān)數(shù)據(jù)可視化方法的說(shuō)法,錯(cuò)誤的是(  )
A.要分析相等時(shí)間間隔下數(shù)據(jù)的發(fā)展趨勢(shì),可采用折線圖
B.要顯示各部分?jǐn)?shù)據(jù)在總數(shù)據(jù)中的大小和比例關(guān)系,可采用餅圖
C.要探究若干數(shù)據(jù)系列中各數(shù)值之間的關(guān)系,可采用柱形圖
D.要比較每個(gè)數(shù)據(jù)相對(duì)中心的數(shù)值變化,可采用雷達(dá)圖
10.下列關(guān)于大數(shù)據(jù)應(yīng)用的說(shuō)法,錯(cuò)誤的是(  )
A.隨著大數(shù)據(jù)在各行各業(yè)的應(yīng)用,數(shù)據(jù)成為核心資產(chǎn)
B.云計(jì)算對(duì)大數(shù)據(jù)的分析應(yīng)用無(wú)太大幫助
C.大數(shù)據(jù)在電子商務(wù)領(lǐng)域的應(yīng)用,為商業(yè)的振興起到了推動(dòng)作用
D.智能交通可以使交通運(yùn)輸服務(wù)和管理智能化
11.文本數(shù)據(jù)處理的主要步驟包括:
①結(jié)果呈現(xiàn) ②特征提取 ③分詞 ④數(shù)據(jù)分析
⑤文本數(shù)據(jù)獲取
正確的順序是(  )
A.⑤②④①③ B.⑤③①④②
C.⑤①③②④ D.⑤③②④①
12.有如下Python程序段。
import pandas as pd
list=[['周欣怡','湖州',15,646],['王培新','杭州',16,598],['張佳明','杭州',16,609],['林逢春','嘉興',15,547],['朱梁棟','湖州',16,588],['陳清瑞','嘉興',15,571]]
inf=pd.DataFrame(list,columns=['姓名','地區(qū)','年齡','總分'])
print(inf)
print('_' 20)
print(inf.groupby('地區(qū)',as_index=True).mean())
執(zhí)行該程序段后,輸出的結(jié)果是     (單選,填字母)。
13.小明從某網(wǎng)站上收集了2022年4月部分生產(chǎn)資料市場(chǎng)價(jià)格變動(dòng)情況數(shù)據(jù),數(shù)據(jù)集保存在“shuju.xlsx”中,格式如圖a所示。
圖a
為分析相關(guān)類(lèi)別生產(chǎn)資料的漲跌幅情況,小明編寫(xiě)了以下Python程序。
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']  #正常顯示中文字體
df=pd.read_excel(″shuju.xlsx″)
df[″漲跌幅″]=         
(1)通過(guò)數(shù)據(jù)計(jì)算添加漲跌幅列,請(qǐng)?jiān)趧澗€處填寫(xiě)實(shí)現(xiàn)的方式。
計(jì)算公式為:漲跌幅=(本期價(jià)格-上期價(jià)格)/本期價(jià)格 100。
(2)若要對(duì)表格中的數(shù)據(jù)進(jìn)行分類(lèi)統(tǒng)計(jì),并求其平均漲跌幅。請(qǐng)完善以下代碼:
g=df.groupby(″類(lèi)別″,as_index=False)
df1=          
df1=df1.sort_values(″漲跌幅″,ascending=False)
(3)根據(jù)上述操作結(jié)果,制作一份顯示類(lèi)別漲跌幅平均值的圖表,其格式如圖b所示。
各種類(lèi)別對(duì)比分析圖
圖b
請(qǐng)完善以下代碼。
plt.figure(figsize=(8,4))
plt.title(″各種類(lèi)別對(duì)比分析圖″)
plt.bar(①      ,df1[″漲跌幅″],label='漲跌幅')
plt.xlabel(″類(lèi)別″)
plt.ylabel(②    )
plt.legend()
plt.show()
14.某市普通高中選課數(shù)據(jù)如下圖所示,學(xué)生從技術(shù)、化學(xué)、生物等科目中選擇三門(mén)作為高考選考科目,“1”表示已選擇的選考科目。
圖a
各學(xué)校技術(shù)選考人數(shù)對(duì)比
圖b
為分析各學(xué)校的學(xué)生選科數(shù)據(jù),編寫(xiě)了如下程序:
import pandas as pd
import matplotlib.pyplot as plt
plt.rc'font', {'family':'SimHei'}
plt.rcParams['axes.unicode_minus']=False
df=pd.read_csv(″xk73.csv″)
(1)若要了解市里所有選考技術(shù)的學(xué)生情況,請(qǐng)?jiān)趧澗€處給出合適代碼,篩選出有選技術(shù)科目的同學(xué)信息:
print(          )
(2)使用Python編程分析每所學(xué)校各科目選考的人數(shù)(不同的學(xué)校代碼表示不同的學(xué)校)。請(qǐng)?jiān)趧澗€處填入合適的代碼。
g=df.groupby(①   ,as index=false)   #按學(xué)校進(jìn)行分組
s2=②                  #按學(xué)校分別統(tǒng)計(jì)各科目的選考人數(shù)
s2.sort_values(″技術(shù)″,ascending=False)   #按技術(shù)選考人數(shù)進(jìn)行降序排序
(3)若要做一個(gè)各學(xué)校技術(shù)選考人數(shù)的分析,添加如下程序段:
plt.figure(figsize=(10,5))
a=list(s2.學(xué)校代碼)
plt.xticks(range(1en(s2.學(xué)校代碼)),a,rotation=45)
#將各學(xué)校代碼按降序順序顯示在x軸上
p1t.③     (range(len(s2.學(xué)校代碼)),
④    )
#對(duì)各學(xué)校及對(duì)應(yīng)技術(shù)選考人數(shù)進(jìn)行繪圖
plt.xlabel(″學(xué)校″)
plt.ylabel(″技術(shù)選考人數(shù)″)
plt.title(″各學(xué)校技術(shù)選考人數(shù)比對(duì)″)
plt.show()
劃線處的代碼應(yīng)為     (單選,填字母)。
A.③barh ④df.技術(shù)
B.③plot ④df.技術(shù)
C.③bar ④s2.技術(shù)
D.③scatter ④s2.技術(shù)
15.某地區(qū)要對(duì)轄區(qū)內(nèi)高中學(xué)生的高考選科情況進(jìn)行統(tǒng)計(jì),前期先用Excel收集各個(gè)學(xué)校每個(gè)學(xué)生的選科數(shù)據(jù),界面如圖所示。
用Python處理上述Excel文件,統(tǒng)計(jì)每個(gè)學(xué)校各個(gè)學(xué)科的選科情況,并用圖表展示學(xué)生人數(shù)最多的5個(gè)學(xué)校的物理學(xué)科與政治學(xué)科人數(shù),代碼如下:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df=pd.read_excel(″xk73.xlsx″)
#讀數(shù)據(jù)到pandas的DataFrame結(jié)構(gòu)中
sc=df.groupby(①     ,as_index=False).count()#按學(xué)校分組計(jì)數(shù)
sc=sc.drop('姓名',axis=1)
#刪除“姓名”列
sc=sc.rename(columns={'學(xué)生編號(hào)':'總?cè)藬?shù)'})
#修改“學(xué)生編號(hào)”為“總?cè)藬?shù)”
sc_sort=sc.sort_values(″總?cè)藬?shù)″,ascending=False)
#對(duì)分組計(jì)數(shù)結(jié)果進(jìn)行排序
x=np.arange(1,6)
#產(chǎn)生列表[1,2,3,4,5]
y1=sc_sort.head()[″物理″]
②     
plt.figure(figsize=(8,4))
plt.bar(x-0.2,y1,label=″wuli″,width=0.4)
plt.bar(x+0.2,y2,label=″zhengzhi″,width=0.4)
plt.ylim(50,400)
plt.legend()
df_sum=pd.DataFrame(data=sc.sum()).T
df_sum['學(xué)校代碼']='合計(jì)'
③   
#顯示圖表
result=sc.append(df_sum)
#增加“合計(jì)”行
result.to_excel(″學(xué)校人數(shù)統(tǒng)計(jì).xlsx″)
#保存結(jié)果
在劃線處填寫(xiě)合適代碼,完善程序。
16.將系統(tǒng)數(shù)據(jù)庫(kù)中高三年級(jí)一周(五天)考勤數(shù)據(jù)導(dǎo)出文件“kq.xlsx”,如圖a所示,統(tǒng)計(jì)各班一周的缺勤率最高的3個(gè)班級(jí)(缺勤率%=一周未到人數(shù)/班級(jí)人數(shù) 100),并制作圖表如圖b所示,部分程序代碼如下,請(qǐng)?jiān)趧澗€處填入合適的代碼。
圖a
一周缺勤率最高的三個(gè)班級(jí)(單位:%)
圖b
import pandas as pd
import matplotlib.pyplot as plt
plt.rc('font', {'family': 'SimHei'})
#讓圖中的中文正常顯示
df = pd.read_excel(″kq.xlsx″)
#讀取Excel文件中的數(shù)據(jù)
df1 = df.groupby(″班級(jí)″).sum()
df1[″缺勤率%″]= df1[″未到″]/(df1[″班級(jí)人數(shù)″]/5) 100
#計(jì)算各班缺勤率%
#按“缺勤率%”降序排序并取前3行
df2 = df1.sort_values(″缺勤率%″, ascending = False).①   
x = df2.index
y = df2[″缺勤率%″]
plt.title(″一周缺勤率最高的三個(gè)班級(jí)(單位:%)″)
#設(shè)置圖表標(biāo)題
plt.②    (x, y)
#繪制柱形圖,如圖b
plt.show()
優(yōu)化集訓(xùn)11 pandas數(shù)據(jù)處理
1.B 解析 本題考查數(shù)據(jù)的相關(guān)知識(shí)。數(shù)據(jù)整理的目的是檢測(cè)和修正有問(wèn)題的數(shù)據(jù),整合數(shù)據(jù)資源,規(guī)整數(shù)據(jù)格式,提高數(shù)據(jù)質(zhì)量,選項(xiàng)A正確;數(shù)據(jù)處理的核心是數(shù)據(jù),數(shù)據(jù)的質(zhì)量直接影響數(shù)據(jù)分析的結(jié)果,選項(xiàng)B錯(cuò)誤。
2.D 解析 本題主要考查的是Hadoop計(jì)算平臺(tái)。Hadoop計(jì)算平臺(tái)適用于對(duì)靜態(tài)數(shù)據(jù)進(jìn)行處理,而對(duì)流數(shù)據(jù)的實(shí)時(shí)處理明顯性能不足,因此答案為D。
3.C 解析 批處理計(jì)算不適用于動(dòng)態(tài)數(shù)據(jù)的處理。
4.D 解析 head(n)函數(shù)返回DataFrame前n行數(shù)據(jù),若不設(shè)置參數(shù)n,則默認(rèn)返回前5行。df[0:5]選取df對(duì)象前5行數(shù)據(jù),df[5]選取df對(duì)象第6列數(shù)據(jù)。
5.D 解析 可以通過(guò)at方法獲取DataFrame對(duì)象單個(gè)數(shù)據(jù)值,格式為df.at[index,column],所以②正確;或者根據(jù)列標(biāo)題先獲取整列,然后通過(guò)行索引獲取單個(gè)數(shù)據(jù)值,其中獲取一列數(shù)據(jù)可以通過(guò)字典記法或?qū)傩詸z索,第三行數(shù)據(jù)的行索引是2,所以④⑤均正確。
6.D 解析 sort_values()函數(shù)中,參數(shù)ascending,默認(rèn)值為T(mén)rue,表示升序,為False時(shí)是降序;對(duì)于DataFrame對(duì)象,可以通過(guò)布爾型數(shù)據(jù)選取滿足條件的行,正確寫(xiě)法為df[df[″總分″]>=600];最后通過(guò)語(yǔ)句⑤輸出結(jié)果。
7.C 解析 統(tǒng)計(jì)各班級(jí)學(xué)生“總分”平均值需要按照“班級(jí)”分組計(jì)算。
df.groupby('班級(jí)').mean()#按“班級(jí)”分組,計(jì)算各純數(shù)值列平均值。
df.groupby('總分').mean()#按“總分”分組,計(jì)算各純數(shù)值列平均值。
df.groupby('班級(jí)')['總分'].mean()#按“班級(jí)”分組,并選取“總分”列計(jì)算平均值。
df.groupby('班級(jí)').總分.mean()#按“班級(jí)”分組,并選取“總分”列計(jì)算平均值。
df.groupby('班級(jí)').describe()#按“總分”分組,計(jì)算各純數(shù)值列的平均值、最大值等統(tǒng)計(jì)數(shù)據(jù)。
8.B 解析 根據(jù)交通路況實(shí)時(shí)更新導(dǎo)航線路中數(shù)據(jù)為流數(shù)據(jù),所以選用流計(jì)算。
9.C 解析 關(guān)系的可視化可采用散點(diǎn)圖或氣泡圖。
10.B 解析 本題考查大數(shù)據(jù)應(yīng)用的相關(guān)知識(shí)。云計(jì)算使千億數(shù)據(jù)的檢索實(shí)現(xiàn)了秒級(jí)返回,為大數(shù)據(jù)的分析提供了速度保障。
11.D 解析 典型的文本處理過(guò)程主要包括分詞、特征提取、數(shù)據(jù)分析、結(jié)果呈現(xiàn)等。
12.B 解析 as_index:為T(mén)rue時(shí)自動(dòng)把第1列作為了index,為False時(shí)默認(rèn)索引0、1、2…。
13.(1)(df.本期價(jià)格-df.上期價(jià)格)/df.本期價(jià)格 100
(2)g.mean() (3)①df[″類(lèi)別″]或df.類(lèi)別 ②″漲跌幅″
解析 (1)根據(jù)數(shù)量關(guān)系確定計(jì)算公式。
(2)計(jì)算平均值使用mean()函數(shù)。
(3)①觀察題圖b可知需要填橫坐標(biāo)數(shù)據(jù)來(lái)源。②此處需要填寫(xiě)橫坐標(biāo)y的標(biāo)簽(ylabel),由題圖可知應(yīng)該是“漲跌幅”。
14.(1)df[df.技術(shù)==1](或df[df[″技術(shù)″]==1]) (2)①″學(xué)校代碼″ ②g.sum()或g.count() (3)D 解析 本題考查pandas及繪圖模塊知識(shí)。(1)Dataframe中,要對(duì)某列進(jìn)行篩選(查找并顯示符合條件的值),可以通過(guò)df[df[″技術(shù)″]==1]或df[df.技術(shù)==1]來(lái)實(shí)現(xiàn)。(2)此處考查pandas中分組函數(shù)groupby的用法。依題意,本條語(yǔ)句按學(xué)校進(jìn)行分組,分組的字段名應(yīng)為“學(xué)校代碼”,故①處填″學(xué)校代碼″;①處代碼已將分組后的對(duì)象賦值組變量g,②空對(duì)其進(jìn)行計(jì)數(shù),故填:g.count()。(3)觀察題圖b,可知當(dāng)前是散點(diǎn)圖(scatter),故選D。
15.①″學(xué)校代碼″ ②y2=sc_sort.head()[″政治″](或y2=sc_sort.head(5)[″政治″]) ③plt.show() 解析 本題考查數(shù)據(jù)處理知識(shí)。①題干說(shuō)明需要“統(tǒng)計(jì)每個(gè)學(xué)校各個(gè)學(xué)科的選科情況”,所以需要根據(jù)“學(xué)校編號(hào)”分類(lèi)匯總統(tǒng)計(jì)各學(xué)校的選科情況,此空填寫(xiě)分組的關(guān)鍵字,答案為“學(xué)校代碼”。②根據(jù)上下文,此空是獲取學(xué)生人數(shù)最多的5個(gè)學(xué)校的政治學(xué)科人數(shù)。前面代碼段已經(jīng)根據(jù)各學(xué)生總?cè)藬?shù)降序排序,再結(jié)合上一段代碼,此空只需要將“物理”修改成“政治”。head()函數(shù)返回DataFrame的前n個(gè)數(shù)據(jù)記錄,如果參數(shù)不寫(xiě),默認(rèn)參數(shù)是5,所以此空答案:y2=sc_sort.head()[″政治″]或y2=sc_sort.head(5)[″政治″]。③代碼段plt.show()的功能是顯示圖形。
16.①head(3) ②bar 解析 本題考查pandas數(shù)據(jù)處理知識(shí)。①根據(jù)提示可知,降序排序前提下取前三行,因此使用head(3)。②垂直柱狀圖,使用bar。
21世紀(jì)教育網(wǎng) www.21cnjy.com 精品試卷·第 2 頁(yè) (共 2 頁(yè))
21世紀(jì)教育網(wǎng)(www.21cnjy.com)

展開(kāi)更多......

收起↑

資源預(yù)覽

<pre id="tfb94"><li id="tfb94"></li></pre>

<bdo id="tfb94"><rt id="tfb94"></rt></bdo>
  • <menu id="tfb94"><dl id="tfb94"></dl></menu><i id="tfb94"><acronym id="tfb94"><sub id="tfb94"></sub></acronym></i>

    1. 主站蜘蛛池模板: 嵊泗县| 鹿泉市| 阳山县| 若羌县| 景德镇市| 秀山| 塔河县| 仙游县| 新营市| 双峰县| 新昌县| 甘谷县| 玛沁县| 安泽县| 湛江市| 尼木县| 且末县| 托克逊县| 安达市| 阳高县| 新闻| 城固县| 巧家县| 株洲县| 阜阳市| 彭水| 腾冲县| 含山县| 民勤县| 濉溪县| 秦皇岛市| 冕宁县| 通山县| 玉屏| 诏安县| 佛冈县| 昭苏县| 周至县| 白河县| 兴城市| 额济纳旗|