токенизировать один конкретный столбец в pandaFrame: ошибка с лямбдой - PullRequest
0 голосов
/ 15 апреля 2019

У меня возникает следующая ошибка при попытке токенизации каждой строки столбца из файла csv, прочитанного с помощью pandas

Traceback (most recent call last):
  File "CSV.py", line 47, in <module>
    df2['tokenized_sentences'] = df2.apply(lambda row: nltk.word_tokenize(row['sentences']), axis=1)
  File "C:\Users\Emmanuelle\AppData\Local\Programs\Python\Python37-32\lib\site-packages\pandas\core\series.py", line 3194, in apply
    mapped = lib.map_infer(values, f, convert=convert_dtype)
  File "pandas/_libs/src\inference.pyx", line 1472, in pandas._libs.lib.map_infer
  File "C:\Users\Emmanuelle\AppData\Local\Programs\Python\Python37-32\lib\site-packages\pandas\core\series.py", line 3181, in <lambda>
    f = lambda x: func(x, *args, **kwds)
TypeError: <lambda>() got an unexpected keyword argument 'axis'

Код является следующим:

df = pd.read_csv(sys.argv[1], na_values = ['no info', '.'], encoding='Cp1252', delimiter=';')
df2 = df.loc[df.index[:], 'Verbatim'] #colonne 
print(df2) #si problème d'affichae changer les apostrophes avec contrôle F dans le fichier Excel
print(type(df2))

df2['tokenized_sentences'] = df2.apply(lambda row: nltk.word_tokenize(row['sentences']), axis=1)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...