Question

У меня есть набор данных, который имеет 154 051 строки и 13 столбцов. В одном из столбцов есть текст. Я хотел бы узнать часто встречающиеся слова. Я хотел убедиться в правильности написания. Итак, я запустил следующий скрипт, но он занимает слишком много времени и все еще работает. Есть ли способ, которым я могу запустить это намного быстрее?

import pandas as pd
from spellchecker import SpellChecker

df = pd.read_excel('D:\Text\Text.xlsx')
df = df.astype({"SEARCH_TEXT": str})

mispelled = " ".join(df["SEARCH_TEXT"]).split()

spell = SpellChecker()
eng=[]
for i in mispelled:
    i=spell.correction(i)
    eng.append(i)

Может кто-нибудь сказать мне более быстрый способ выполнения этого?

Как быстрее скомпилировать мой скрипт проверки орфографии?Мои текущие сценарии занимают слишком много времени

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как быстрее скомпилировать мой скрипт проверки орфографии?Мои текущие сценарии занимают слишком много времени

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы