|||
import pandas as pd
(1)Pandas 遇到 cannot handle a non-unique multi-index
可能是因为索引项不唯一造成的,去掉重复的索引即可。
(2)pandas dataframe 去掉重复的行
df=df.loc[~df.index.duplicated(keep='first')]
(3)pandas 去掉特殊列重复项;
先产生数据框
以A,B两列为ID; 有两个重复项 1,a, 1,a 去掉一项; 默认情况是keep='frist'
运行下面命令, 去掉了第一行。但行号从0 跳到了2.
reset_index()之后,行号从0-3 正常; 但多了原来的行号0,2,3,4;
。
添加drop=True ; reset_index(drop=True)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 08:59
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社