Python Чтение таблиц Excel - PullRequest
       3

Python Чтение таблиц Excel

0 голосов
/ 10 июля 2020
import pandas as pd
    
#Read File
contacts_file = pd.read_excel("Contacts_Sheet.xlsx", sheet_name="Sheet1", email=[1])
    
#Get emails
real_email = contacts_file["@" in contacts_file["Company Email:"]]
    
#Output Doc
real_email.to_excel("All_emails.xlsx")

У меня есть электронная таблица с адресами электронной почты и названиями компаний, но есть много компаний, где электронные письма не могут быть найдены, и вместо них указано «NA». Я хочу создать программу, которая будет извлекать все электронные письма из столбца 2 с названиями компаний в столбце 1, но я не могу понять, как «искать» электронные письма. Моя мысль заключалась в том, чтобы найти "@" в каждой строке, потому что это единственное, что отличает электронные письма от других строк. Это то, что я пытался сделать в приведенном выше коде.

1 Ответ

0 голосов
/ 10 июля 2020

Вам нужно str.contains

т.е.

df = pd.DataFrame({'Company' : ['A','B'],
             'Email'  : ['test@test.com',np.nan]})

print(df)

  Company          Email
0       A  test@test.com
1       B            NaN

df_new = df[df['Email'].str.contains('@')==True]

print(df_new)

      Company          Email
    0       A  test@test.com
...