Как быстрее скомпилировать мой скрипт проверки орфографии?Мои текущие сценарии занимают слишком много времени - PullRequest
1 голос
/ 03 июня 2019

У меня есть набор данных, который имеет 154 051 строки и 13 столбцов. В одном из столбцов есть текст. Я хотел бы узнать часто встречающиеся слова. Я хотел убедиться в правильности написания. Итак, я запустил следующий скрипт, но он занимает слишком много времени и все еще работает. Есть ли способ, которым я могу запустить это намного быстрее?

import pandas as pd
from spellchecker import SpellChecker

df = pd.read_excel('D:\Text\Text.xlsx')
df = df.astype({"SEARCH_TEXT": str})

mispelled = " ".join(df["SEARCH_TEXT"]).split()

spell = SpellChecker()
eng=[]
for i in mispelled:
    i=spell.correction(i)
    eng.append(i)

Может кто-нибудь сказать мне более быстрый способ выполнения этого?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...