Мне нужно отфильтровать столбец с начала предложения - PullRequest
1 голос
/ 24 января 2020

В моем коде я могу отфильтровать столбец по точным текстам, и он работает без проблем. Однако необходимо отфильтровать другой столбец с началом предложения. Фразы в этом столбце: A_2020.092222 A_2020.090787 B_2020.983898 B_2020.209308 Итак, мне нужно получить все, что начинается с A_20 и B_20.

Заранее спасибо

Мой код :

from bs4 import BeautifulSoup
import pandas as pd
import zipfile, urllib.request, shutil, time, csv, datetime, os, sys, os.path


#location
dt = datetime.datetime.now()
file_csv = "/home/Downloads/source.CSV"
file_csv_new = "/var/www/html/Data/Test.csv"

#open CSV
with open(file_csv, 'r', encoding='CP1251') as file:
 reader = csv.reader(file, delimiter=';')
 data = list(reader)

#list to dataframe
df = pd.DataFrame(data)

#filter UF
df = df.loc[df[9].isin(['PR','SC','RS'])]

#filter key
# A_ & B_
df = df.loc[df[35].isin(['A_20','B_20'])]

#print (df)
#Empty DataFrame
#Columns: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ...]
#Index: []

#[0 rows x 119 columns]```

1 Ответ

0 голосов
/ 24 января 2020

Попробуйте следующее:

lst1 = ['A_2020.092222', 'A_2020.090787 ', 'B_2020.983898', 'B_2020.209308', 'C_2020.209308', 'D_2020.209308'] 

df = pd.DataFrame(lst1,   columns =['Name']) 

df.loc[df.Name.str.startswith(('A_20','B_20'))]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...