Перевод большого количества CSV-файла (набор данных Flickr8k_text) на непальский язык в python - PullRequest
0 голосов
/ 12 марта 2020

Я работал в проекте создания субтитров на непальском языке. В части набора данных я попытался перевести весь текст заголовков Engli sh на непальский из набора данных Flickr8k. Для этого я использую python translate инструмент как

dataset = pd.read_csv('/content/gdrive/My Drive/out.csv',delimiter = '\t')
dataset.drop('Unnamed: 0',axis = 1)
def trans(x):
    translator= Translator(to_lang="ne")
    return translator.translate(x)
dataset['caption'] = dataset['caption'].apply(trans)
print('done')

Но он перевел только 130 строк подписей на непальский язык, а затем все остальные тексты будут переведены как

ПРЕДУПРЕЖДЕНИЕ ПО ПАМЯТИ : ВЫ ИСПОЛЬЗУЛИ ВСЕ ДОСТУПНЫЕ БЕСПЛАТНЫЕ ПЕРЕВОДЫ ЗА СЕГОДНЯ. СЛЕДУЮЩАЯ В НАЛИЧИИ В 23 ЧАСА 24 МИНУТЫ 38 СЕКТОР ПОСЕТИТЬ, ЧТОБЫ ПЕРЕВОДИТЬ БОЛЬШЕ

Можно ли как-то перевести все тексты одновременно ??

Я тоже пробовал googletrans, но также происходит сбой из-за частого запроса к API

Примечание: набор данных содержит 40458 строк с предложениями Engli sh в столбце заголовка.

Будет очень полезно, если есть какой-либо способ перевести все текст и заранее спасибо:)

1 Ответ

0 голосов
/ 15 марта 2020

Хорошо, я понял это сам. Используйте Google лист и импортируйте ваш CSV-файл и создайте столбец с заголовком с именем целевого языка и используйте формулу =googletranslate(cell_with_text, "source_language", "target_language")

пример: =googletranslate(A2,"en","ne") теперь из угла ячейки, где указатель мыши выглядит как + как знак и опускание до конца, а в ячейке go вы можете перевести весь текст в столбце за один раз.

...