У меня есть DataFrame, где каждая ячейка содержит текст строки.В этих текстах есть некоторые шаблоны, в соответствии с которыми я хочу разбить строку, так что она становится списком строк
0 'bla bla*bla bla bla*bla'
вывод должен выглядеть так:
0 ['bla bla','bla bla bla','bla]
я делаюэто со следующим кодом:
splitter = '='*80
df.Text=df.Text.apply(lambda x: x.split(splitter))
странно то, что для некоторых файлов это работает, но для других он говорит:
'список' объект не имеет атрибута 'split '
, хотя в оригинальном df.Text оба выглядят одинаково
Я читаю файлы, используя
result_list=[]
for file in file_list:
inputlen = file [len(input_path):]
name = inputlen [:12]
with open(file, "r", encoding="utf-8", errors="surrogateescape") as rfile:
text = rfile.read()
text = text.encode('utf-8', 'ignore')
text = text.decode('utf-8', 'ignore')
a={'TA Date':name, 'Text':text}
result_list.append(a)
df =pd.DataFrame(result_list)
, так что может быть толькоодин файл в одной ячейке