Есть ли способ обнаружить английские sh слов в строке в pandas - PullRequest
0 голосов
/ 20 июня 2020

У меня есть датафрейм с песнями, исполнителями и текстами. Есть песни, тексты которых написаны не на английском sh языке, а буквы латинские. Есть ли способ отделить английские sh слова (которые имеют значение на английском sh) от неанглианских sh слов (которые написаны латинскими буквами, но не имеют значения sh на английском языке). Любая Python библиотека или какой-то код? Моя главная цель - провести анализ настроений по текстам песен.

1 Ответ

2 голосов
/ 20 июня 2020

Для этого в python есть библиотека, которая называется langdetect .

Вот пример ее использования:

>>> from langdetect import detect
>>> detect("War doesn't show who's right, just who's left.")
'en'
>>> detect("Ein, zwei, drei, vier")
'de'
...