У меня есть набор данных, который имеет 154 051 строки и 13 столбцов. В одном из столбцов есть текст. Я хотел бы узнать часто встречающиеся слова. Я хотел убедиться в правильности написания. Итак, я запустил следующий скрипт, но он занимает слишком много времени и все еще работает. Есть ли способ, которым я могу запустить это намного быстрее?
import pandas as pd
from spellchecker import SpellChecker
df = pd.read_excel('D:\Text\Text.xlsx')
df = df.astype({"SEARCH_TEXT": str})
mispelled = " ".join(df["SEARCH_TEXT"]).split()
spell = SpellChecker()
eng=[]
for i in mispelled:
i=spell.correction(i)
eng.append(i)
Может кто-нибудь сказать мне более быстрый способ выполнения этого?