как узнать количество удаленных строк с помощью панд - PullRequest
0 голосов
/ 28 мая 2018

Вот из этого 2 .csv файлов фильтрации и общих почтовых идентификаторов удалены, я могу получить общее количество после удаления, но есть ли вариант, который дает, сколько строк удаляется с помощью панд.

используя mysql: удалите a из данных a, data1 b, где a.email = b.email;выберите row_count ();Как это можно сделать с помощью панд

import pandas as pd

colnames=['id','emailid']

data=pd.read_csv("input.csv",names=colnames,header=None)

colnames=['email']

data1= pd.read_csv("compare.csv",names=colnames,header=None)

emailid_suppress1=data1['email'].str.lower()

suppress_md5=data[~data['emailid'].isin(emailid_suppress1)]

print suppress_md5.count()

1 Ответ

0 голосов
/ 28 мая 2018

Я считаю, что нужно sum из True s значений, которые являются процессами типа 1:

data = pd.DataFrame({'id':list('abcde'), 'emailid':list('klmno')})
print (data)
  id emailid
0  a       k
1  b       l
2  c       m
3  d       n
4  e       o

data1 = pd.DataFrame({'email':list('ABCKLDEFG')})
print (data1)
  email
0     A
1     B
2     C
3     K
4     L
5     D
6     E
7     F
8     G

emailid_suppress1=data1['email'].str.lower()

print ((~data['emailid'].isin(emailid_suppress1)).sum())
3

suppress_md5=data[~data['emailid'].isin(emailid_suppress1)]
print (suppress_md5)
  id emailid
2  c       m
3  d       n
4  e       o

РЕДАКТИРОВАТЬ:

print ((data['emailid'].isin(emailid_suppress1)).sum())
2

suppress_md5=data[data['emailid'].isin(emailid_suppress1)]

print (suppress_md5)
  id emailid
0  a       k
1  b       l
...