Как определить язык объекта данных? - PullRequest
0 голосов
/ 04 мая 2019

Я хочу создать новый столбец в своем обзоре фрейма данных с указанием языка текста столбца типа объекта.

Я пытаюсь преобразовать в строку, а затем использую функцию обнаружения из langdetect, но при запуске кода все равно возникает ошибка типа.

Я не понимаю, проблема LOL

Мой код:

from langdetect import detect


review['langue'] = detect((review['text']).astype(str))

Фактический результат:

--------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)


TypeError: expected string or bytes-like object

1 Ответ

0 голосов
/ 04 мая 2019

Если я правильно понял ваш вопрос, вам нужно

from langdetect import detect
review['langue'] = review['text'].apply(detect)

detect функция ожидает str в качестве аргумента, а не pd.Series.Вместо этого вы должны применить функцию detect к каждому элементу review['text'] pd.Series.

...