Как вы пытаетесь очистить данные?Образцы данных, которые у вас есть, могут быть разбиты с помощью '\ r \ n' в качестве разделителя.Вы можете фильтровать список после разделения на основе того, пуста ли строка в списке или нет.Это может быть сделано в качестве основного процесса очистки данных.Часть, которая имеет отношение к вам, вы решаете сами.
Базовый код для очистки может быть:
mystr = '\r\nContact Imported:\r\nBusinessPhone : 9547711900 Line1 : 2440 East Commercial Blvd.\r\n City : Ft. Lauderdale\r\n State : FL\r\n PostalCode : 33308\r\n\r\nArt Womack recommends Steve Paul Dentist on Commercial Blvd area.\r\nA_womack@me.com>\r\nBond? Crowns? Veneer?\r\n\r\n\r\n'
data = mystr.split('\r\n')
data_filtered = list(filter(lambda x: x, data))
for d in data_filtered:
print(d.strip())
Это выдаст:
Contact Imported:
BusinessPhone : 9547711900 Line1 : 2440 East Commercial Blvd.
City : Ft. Lauderdale
State : FL
PostalCode : 33308
Art Womack recommends Steve Paul Dentist on Commercial Blvd area.
A_womack@me.com>
Bond? Crowns? Veneer?
Вам все еще нужновыяснить, что важно.
Редактировать: На основе данной строки вы можете использовать это:
def convert(x):
d = x.split(':')
newlist = []
if len(d) > 2:
# Hack will work only in few cases, including this case
vals = d[1].strip().split(' ')
newlist.append(f'{d[0]}:{vals[0]}')
newlist.append(f'{vals[1]}:{d[2]}')
return newlist
return [x]
mystr = '\r\nContact Imported:\r\nBusinessPhone : 9547711900 Line1 : 2440 East Commercial Blvd.\r\n City : Ft. Lauderdale\r\n State : FL\r\n PostalCode : 33308\r\n\r\nArt Womack recommends Steve Paul Dentist on Commercial Blvd area.\r\nA_womack@me.com>\r\nBond? Crowns? Veneer?\r\n\r\n\r\n'
data = mystr.split('\r\n')
data_filtered = list(filter(lambda x: x, data))
data_filtered_2 = list((map(lambda x: convert(x), data_filtered)))
data_combined = []
for i in data_filtered_2:
data_combined += i
for d in data_combined:
print(d.strip())