У меня есть файл с разделителями, который вызывает у меня некоторое горе.Это разделенная труба, 6 полей.но поле 4 может быть разбито на несколько строк или не содержать ничего.Мне нужен способ удалить поля новой строки из поля 4.
Вот что у меня есть
import csv
#header is constant
#filedone|fieldtwo|three|four|five|six
content = """"asfdd|b|c|defg
ijklmnopque2
|record|sadfe
1324|b|c|defg
ijklmnopqu
dafdsasfde2asdf
dsfdsf
dsfadfadse2fdsase2
asdfasdfasfe2
|record|afasde
3243243|b|c|defg
ijklmnopque2
|record|adf
startrecord4|b|c||record|adf
"""
def extract():
x = []
y = []
x = content.split('|')
for item in x:
if (len(item) > 4):
y.append(item.replace('\n', '').replace('\r', ' '))
else:
y.append(item)
print(y)
if __name__ == '__main__':
extract()
Это запустится, и проблема простовывести все это в один ряд.Мне все еще нужно, чтобы он выводил индивидуальные записи (в данном случае 4) без перевода строки, но я не уверен, как это сделать.Могу ли я прочитать весь файл с помощью pandas.read_csv?Есть ли лучшее решение?
Заголовок постоянен во всех записях.