cliffgao的个人博客分享 http://blog.sciencenet.cn/u/cliffgao 兴趣:生物信息学、统计、概率

博文

Pandas 索引项 问题 (行号)

已有 1206 次阅读 2020-4-28 14:12 |个人分类:python|系统分类:科研笔记| pandas

import pandas as pd

(1)Pandas  遇到  cannot handle a non-unique multi-index

可能是因为索引项不唯一造成的,去掉重复的索引即可。


(2)pandas  dataframe  去掉重复的行

参考  https://stackoverflow.com/questions/13035764/remove-rows-with-duplicate-indices-pandas-dataframe-and-timeseries


df=df.loc[~df.index.duplicated(keep='first')]


(3)pandas   去掉特殊列重复项;

先产生数据框

图片.png


以A,B两列为ID;  有两个重复项 1,a, 1,a  去掉一项; 默认情况是keep='frist'

运行下面命令, 去掉了第一行。但行号从0 跳到了2.

图片.png


reset_index()之后,行号从0-3 正常; 但多了原来的行号0,2,3,4;

图片.png



添加drop=True ;  reset_index(drop=True)

图片.png








http://blog.sciencenet.cn/blog-468005-1230568.html

上一篇:R 输出list 对象到文件
下一篇:numpy 产生重复的数、一维向量。

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-12-4 08:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部