在pandas多重索引multiIndex中選定指定索引的行方法

2020-02-15 23:43:28

字體：大中小

供稿：網(wǎng)友

在multiIndex中選定指定索引的行

我們?cè)谟胮andas類似groupby來使用多重index時(shí)，有時(shí)想要對(duì)多個(gè)level中的某個(gè)index對(duì)應(yīng)的行進(jìn)行操作，就需要在dataframe中找到該index對(duì)應(yīng)的行，在單層index中我們可以方便的使用df.loc[index]來選擇，在多重Index中我們可以利用的類似的思路，然而其中也有一些小坑，記錄如下。

1 index為有序的

1.1 創(chuàng)建測(cè)試數(shù)據(jù)

首先創(chuàng)建一個(gè)dataframe數(shù)據(jù)

df = pd.DataFrame({'class':['A','A','A','B','B','B','C','C'],   'id':['a','b','c','a','b','c','a','b'],   'value':[1,2,3,4,5,6,7,8]})

df中內(nèi)容如下圖：

pandas multiIndex選定指定索引的行

1.2 設(shè)置multiIndex

通過set_index設(shè)為多重索引

df = df.set_index(['class','id'])

設(shè)置索引后效果：

pandas multiIndex選定指定索引的行

1.3 切片篩選index

這里同樣使用loc定位

df.loc[('A',slice(None)),:]

各參數(shù)的解釋如下：

loc[(a,b),c]中第一個(gè)參數(shù)元組為索引內(nèi)容，a為level0索引對(duì)應(yīng)的內(nèi)容，b為level1索引對(duì)應(yīng)的內(nèi)容

因?yàn)閐f是一個(gè)dataframe，所以要用c來指定列

這里‘A'，指選擇class中的A類

slice(None), 是Python中的切片操作，這里用來選擇任意的id，要注意！不能使用‘:'來指定任意index

‘:',用來指定dataframe任意的列

執(zhí)行后的結(jié)果如下：

pandas multiIndex選定指定索引的行

同樣，如果想只保留id中的'a'，則可以使用：

df.loc[(slice(None),'a'),:]

2 index無序

前面的例子對(duì)應(yīng)的index列為數(shù)字或字母，是有序的，接下來我們看看index列為中文的情況。

2.1 創(chuàng)建無序測(cè)試數(shù)據(jù)

df2 = pd.DataFrame({'課程':['語文','語文','數(shù)學(xué)','數(shù)學(xué)'],'得分':['最高','最低','最高','最低'],'分值':[90,50,100,60]})df2 = df2.set_index(['課程','得分'])

pandas multiIndex選定指定索引的行

2.2 嘗試切片選擇index

df2.loc[('語文',slice(None)),:]

我們進(jìn)行同樣的操作，這時(shí)會(huì)發(fā)現(xiàn)提示出錯(cuò)：

UnsortedIndexError: 'MultiIndex Slicing requires the index to be fully lexsorted tuple len (2), lexsort depth (0)'

這是因?yàn)榇藭r(shí)的index無法進(jìn)行排序，在pandas文檔中提到：Furthermore if you try to index something that is not fully lexsorted, this can raise:

我們可以通過 df2.index.is_lexsorted()來檢查index是否有序，

上一篇：python爬取淘寶商品銷量信息

下一篇：python微信好友數(shù)據(jù)分析詳解

學(xué)習(xí)交流

如何重啟打印機(jī)打印服務(wù)

如何重啟打印機(jī)打印服務(wù)...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關(guān)注

麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

在pandas多重索引multiIndex中選定指定索引的行方法