Я работаю с анализом текста, и перед обработкой данных мне нужно исправить слова (английский язык), которые хранятся в файле .CSV.
Я получил то, что хотел, используя python и библиотеку TextBlob. Сначала я перехожу к исходному файлу, TextBlob автоматически исправляет все неправильные слова из файла, и в результате создается файл с исправленными словами.
Вы можете проверить код Python здесь:
import nltk
import string
import re
from textblob import TextBlob
with open(file.csv', 'r') as inFile, open('fileOutput.csv', 'w') as outFile:
for line in inFile:
print (TextBlob(line).lower().correct().strip(), file=outFile) #this function turns all words into lowercase and corrects incorrect words
print(inFile)
Пожалуйста, кто-нибудь может сказать мне какой-нибудь пакет в R, который делает что-то подобное? Я не нашел пакетов, которые могли бы автоматически исправлять слова, используя R.