Я занимаюсь анализом настроений в твиттере. Большинство твитов содержат короткие слова, и я хочу заменить их как оригинальные / полные слова.
Предположим, что твит:
I was wid Ali.
Я хочу конвертировать:
wid -> with
Аналогично
wud -> would
u -> you
r -> are
У меня 6000 твитов, в которых много коротких слов.
Как я могу их заменить? есть ли в Python библиотека для этой задачи? или какой-нибудь словарь коротких слов доступен онлайн?
Я прочитал ответ Заменить апостроф / короткие слова в Python Вопрос, но он содержит только словарь апостроф.
В настоящее время я использую NLTK, но эта задача невозможна с NLTK.