split () иногда не принимается в пандах - PullRequest
0 голосов
/ 12 июня 2019

У меня есть DataFrame, где каждая ячейка содержит текст строки.В этих текстах есть некоторые шаблоны, в соответствии с которыми я хочу разбить строку, так что она становится списком строк

0 'bla bla*bla bla bla*bla'

вывод должен выглядеть так:

0 ['bla bla','bla bla bla','bla]

я делаюэто со следующим кодом:

splitter = '='*80
df.Text=df.Text.apply(lambda x: x.split(splitter))

странно то, что для некоторых файлов это работает, но для других он говорит:

'список' объект не имеет атрибута 'split '

, хотя в оригинальном df.Text оба выглядят одинаково

Я читаю файлы, используя

result_list=[]
for file in file_list:
inputlen = file [len(input_path):]
name = inputlen [:12]
with open(file, "r", encoding="utf-8", errors="surrogateescape") as     rfile:

    text = rfile.read()
    text = text.encode('utf-8', 'ignore')
    text = text.decode('utf-8', 'ignore')
a={'TA Date':name, 'Text':text}
result_list.append(a)
df =pd.DataFrame(result_list)

, так что может быть толькоодин файл в одной ячейке

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...