Исходя из пересмотра вашего вопроса и обсуждения в комментариях, я считаю, что вам нужно использовать следующую строку:
df['txt'] = df['txt'].apply(lambda x: [clean_text(z) for z in x])
В этом подходе apply
используется с lambda
дляЗацикливание каждого элемента серии txt
, в то время как простой цикл for (выраженный с использованием списка Python) используется для перебора каждого элемента в подсписке txt
.
Я протестировал этот фрагментсо следующим значением для data
:
data = {
'value': [
'abc.txt',
'cda.txt',
],
'txt':[
[
'2019/01/31-11:56:23.288258 1886 7F0ED4CDC704 asfasnfs: remove datepart',
],
[
'2019/02/01-11:56:23.288258 1886 7F0ED4CDC704 asfasnfs: remove datepart',
],
]
}
Ниже приведен фрагмент консольного вывода, показывающий кадр данных до и после преобразования:
>>> df
value txt
0 abc.txt [2019/01/31-11:56:23.288258 1886 7F0ED4CDC...
1 cda.txt [2019/02/01-11:56:23.288258 1886 7F0ED4CDC...
>>> df['txt'] = df['txt'].apply(lambda x: [clean_text(z) for z in x])
>>> df
value txt
0 abc.txt [asfasnfs remove datepart]
1 cda.txt [asfasnfs remove datepart]
>>>