Я пытаюсь перевести текст в столбце в pandas dataframe, который частично на японском и частично на английском на английский.
Вот так выглядит мой набор данных
Я хочу перевести столбец «описание»
Я использую приведенный ниже код для достижения этой цели: -
raw_data_non_english ['translation_text_1'] = raw_data_non_english ['description']. Apply (translationator.translate, dest = 'en'). Apply (getattr, args = ('text',))
Я описал проблему с переводом здесь Почему переводчик Google пропускает какой-то текст в Python?
Другим примером проблемы является
string = '' 'Документация для перевозки опасных продуктов не полностьюManipulace s nebezpečnými látkami / přeprava (Чешская Республика) Qn 2.71 Капитолий 5,4 года, документация о том, что он может быть наложен на человека, 8, Капитолия 8.1.2. ДОПОГ. обзор - Документация для перевозки опасных продуктов не полностью '' '
* * Translator.translate тысячи двадцать-одина (строка) .text * * тысяча двадцать-дв
Это пропускает много текста в выводе. Однако, если я изменяю строку на многострочную строку, чтобы одна строка была полностью на английском, а другая - на другом языке, как показано ниже, перевод в порядке.
string = '' 'Документация для перевозки опасных продуктов не полностью
Manipulace s nebezpečnými látkami / přeprava
(Чехия)
Qn 2,71 Jestliže zařízení odesílá nebezpečné zboží к přepravě ро silnici, přeprava zboží АДР JE Баннеры южной Моравии doprovázena přepravním dokumentem nebezpečného zboží předepsaným против kapitole 5.4 požadovanou dokumentací, která má Byt naložena против přepravních jednotkách, Jak JE uvedeno против Casti 8, kapitola 8.1.2 dohody ADR. обзор - Документация для перевозки опасных продуктов не полностью '' '
translator.translate (строка) .text
Хотите понять, как изменения форматирования должны применяться к тексту столбца перед переводом