У меня есть DataFrame с некоторыми текстовыми функциями, ie функция, называемая «работа», с некоторыми событиями, такими как «полицейский», «Юрист», «доктор» и др. c. Как и в следующем Python коде:
import pandas as pd
dict = {'age' : [19, 35, 47], 'job' : ['policeman', 'lawyer', 'doctor']}
df = pd.DataFrame(dict)
Я хотел бы знать, как преобразовать строки в заданиях в int, например 0, 1, 2, так что 'Policeman' - это категория 0, «юрист», категория № 1 и т. д. 1010 * ..
В более широком смысле, мой вопрос заключается в том, чтобы найти способ эффективно рассчитывать прогнозы для этого набора данных со стандартными библиотеками (например, Склеарн). Поскольку они не поддерживают строки как функцию, я подумал, что смогу вручную преобразовать их в int. Это действительно хорошая идея?