Как исправить слова автоматически, используя R? - PullRequest
0 голосов
/ 13 марта 2019

Я работаю с анализом текста, и перед обработкой данных мне нужно исправить слова (английский язык), которые хранятся в файле .CSV.

Я получил то, что хотел, используя python и библиотеку TextBlob. Сначала я перехожу к исходному файлу, TextBlob автоматически исправляет все неправильные слова из файла, и в результате создается файл с исправленными словами.

Вы можете проверить код Python здесь:

    import nltk
    import string
    import re
    from textblob import TextBlob

    with open(file.csv', 'r') as inFile, open('fileOutput.csv', 'w') as outFile:
        for line in inFile: 
                print (TextBlob(line).lower().correct().strip(), file=outFile) #this function turns all words into lowercase and corrects incorrect words

    print(inFile)

Пожалуйста, кто-нибудь может сказать мне какой-нибудь пакет в R, который делает что-то подобное? Я не нашел пакетов, которые могли бы автоматически исправлять слова, используя R.

...