Python pandas: создайте новый столбец со значениями на английском языке, преобразовав значения, хранящиеся в другом столбце, на традиционном китайском - PullRequest
0 голосов
/ 11 июня 2018

У меня есть столбец "City_trad_chinese" в кадре данных pandas "df", который содержит значения на традиционном китайском языке.Мне нужно создать еще один столбец "City_English", который должен содержать переведенные значения на английском языке.

Как я могу сделать это с Python?Я попробовал следующее:

#importing required libraries
import pandas as pd 

from os import path

from googletrans import Translator

#setting path to data
path2data = 'C:/Users/data'

# data import
df = pd.read_excel(path.join(path2data, 'data.xlsx'), converters={'City_trad_chinese':str})


translator = Translator()

df['City_English'] = df['City_trad_chinese'].map(lambda x: translator.translate(x, src="zh-TW", dest="en").text)

, но выдает ошибку:

raise JSONDecodeError("Expecting value", s, err.value) from None

JSONDecodeError: Expecting value

1 Ответ

0 голосов
/ 11 июня 2018

Вы можете использовать библиотеку googletrans

import pandas as pd
from googletrans import Translator

d = {"City_trad_chinese":["香港特别行政区",
                          "澳门特别行政区",
                          "北京市",
                          "上海市"]}
df = pd.DataFrame(data=d)

translator = Translator()

df["City_English"] = df["City_trad_chinese"].map(lambda x: translator.translate(x, src="zh-TW", dest="en").text)

print(df["City_English"])

0    Hong Kong Special Administrative Region
1        Macao Special Administrative Region
2                               Beijing City
3                              Shanghai City

Примечание: API Google Translate имеет 15kпредел символов .Вы можете обойти это, переведя каждую строку в отдельности:

df["City_English"] = ""

for index, row in df.iterrows():
    translator = Translator()
    eng_text = translator.translate(row["City_trad_chinese"], src="zh-TW", dest="en").text
    row["City_English"] = eng_text
...