LImetrics的个人博客分享 http://blog.sciencenet.cn/u/LImetrics

博文

python学习——根据条件提取数据,并去重

已有 8757 次阅读 2018-9-27 20:26 |个人分类:python学习|系统分类:科研笔记| python, 字符串提取, 字符串去重, python, python

源代码:python_extract_char.py

[Python字符串提取]

摘要:根据要求进行字符串的提取,并去重

导入分析所需的库

  import pandas as pd


构造数据集

   as1 = pd.DataFrame({'a':[1,2,3,4], 
          'b':['adwdea,asdw;swa,des','swa,dwad;asdw;swa','se;dw,asd;erf,de','de']})

微信截图1.png

编写分析函数

    

def trans(b):
  as1['c'] = b.str.split(";") 
  c = as1['c'].tolist()
  for i in range(len(c)):
      for j in range(len(c[i])):
        c[i][j] = c[i][j].split(",")[0]
  return c
trans(as1['b'])
as1['d'] = as1['c'].apply(lambda x:set(x)).apply(lambda x:",".join(x))
as1





https://blog.sciencenet.cn/blog-3262505-1137397.html


下一篇:python学习——数据批量替换
收藏 IP: 202.113.11.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-2 06:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部