Неизвестные значения при переборе данных - PullRequest
0 голосов
/ 18 октября 2018

Я использую библиотеку гендерных догадок, чтобы угадать пол по имени.

import gender_guesser.detector as gender
 d = gender.Detector()

 print(d.get_gender(u"Bob"))
 male
gen = ['Alice', 'Bob', 'Kattie', "Jean", "Gabriel"]
female
male
female
male
male

Но когда я пытаюсь повторить его по фрейму данных pandas, я получаю вывод как неизвестный

for name in df1['first_name'].iteritems():
print(d.get_gender(name))

1 Ответ

0 голосов
/ 18 октября 2018

Один из способов - использовать карту.

df1['gender'] = df1['first_name'].map(lambda x: d.get_gender(x))

Это создаст новый столбец с именем «пол».Я думаю, что это должно быть быстрее, чем iteritems.

...