資源簡介 DataFrame之排序、分組聚合 補充書本p124import pandas as pddf1=pd.read_excel('成績.xlsx') #讀取文件'成績.xlsx'1.排序方法:表名. sort_values('列名',axis=0,ascending=True,inplace=False)axis=0表示進行上下排序。axis默認值為0,可以省略 ascending=True表示升序;ascending=False表示降序 inplace=False 實際行的順序沒有改變1.表名.sort_values('列名',ascending=True) #按照列名進行升序排序 等價于df1.sort_values('列名') 2.表名.sort_values('列名',ascending=False) #按照列名進行降序排序 3.表名.sort_values(['列名1','列名2'],ascending=False) #先按照列名1進行降序排序,列名1相同按照列名2 進行降序排序①_____________________________________ #按照'語文'成績進行升序排序_____________________________________ #按照'語文'成績進行升序排序_____________________________________ #按照'語文'成績進行降序排序②_________________________________________ #按照'數學'成績進行降序排序③________________________________________________________________2.分組聚合groupby2.1直接將列名作為索引import pandas as pd df2=pd.read_excel('成績.xlsx') #讀取'成績.xlsx'存在df2 #對班級分組并求平均,索引為班級 g = ________________________________________________ 等價寫法:2.as_index=False 不作為索引。索引即默認行號0 1 2…import pandas as pd df2=pd.read_excel('成績.xlsx') #對班級分組并求平均,索引為0 1 2 3.. g1=________________________________________________[練習1:]import pandas as pd讀取"cs.xlsx" 內容df=_______________________________________#按照type進行分組并計算各type數量g1= _______________________________________g2=________________________________________g1 g2[練習2]import pandas as pddf=pd.read_excel("cs.xlsx")g=____________________#按照type進行分組#計算各type平均值并保留兩位小數datas=________________________________#對分組求平均值后的結果按照salary降序排序___________________________________________[練習3,本質和練習2一樣,只是練習2分開寫了]import pandas as pddf=pd.read_excel("cs.xlsx")#按照type進行分組并計算各type平均值并保留兩位小數g=____________________________________________#此時索引為_____#對分組后的結果按照salary降序排序g1=________________________________________________________________g(分組后): g1(排序后):在上面排序后的基礎上建立圖表import matplotlib.pyplot as plt #導入模塊,起個小名“plt”import numpy as np #導入numpy模塊plt.rcParams['font.sans-serif']=['simHei'] #解決中文亂碼plt.rcParams['axes.unicode_minus']=False #解決中文亂碼import pandas as pddf1=pd.read_excel('成績.xlsx')g1 = df1.groupby('班級').mean().round(1) #此時:行索引為_____x=g1.indexy=g1['語文']plt.bar(x,y,label='班級語文平均分')plt.legend()plt.show()import pandas as pddf1=pd.read_excel('成績.xlsx')g2=df1.groupby('班級',as_index=False).mean().round(1) #此時行索引為_____x=g2['班級']y=g2['語文']plt.bar(x,y,label='班級語文平均分')plt.legend()plt.title('平均分')plt.show()import pandas as pdimport matplotlib.pyplot as plt#下面pd. set_option()處理列數據無法對齊的情況pd.set_option('display.unicode.ambiguous_as_wide',True)pd.set_option('display.unicode.east_asian_width',True)plt.rcParams['font.sans-serif'] = 'simhei' #圖表顯示中文字體df=__________________________ #讀取文件data.xlsx_________________________________ #修改第 1 行文件架的銷售人員為“畢春#計算出每一筆業業務利潤=數量*(銷售單價-成本)df["利潤"]=__________________________________________________#按"商品名稱"統計本月"銷售數量","利潤"的總和df1=_______________________________________________________#篩選出本月賺錢較多的前3種商品(利潤最高的前3條,先排序再取前3行)print(_________________________________________________)#統計本月每一位銷售人員的商品銷售數量df2=__________________________________________________________#篩選出本月銷售數量>50 或銷售數量<100 的銷售人員print(_________________________________________________)x=________________________;y=df2["銷售數量"]#以垂直柱形圖的形式統計顯示所有銷售員的業績plt.figure(figsize=(8,4))plt.title("商場運營情況分析")plt.bar(x,y,label="銷售人員業績圖",color="r")plt.legend( )plt.show() 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫