У меня есть такой набор данных:
EmployeeID BenefitsType Status YearsInJob Tenure
000001 M A 3.1 3-
000002 O T 2.9 2-3
000003 N A 5.1 3-
000004 B A 0.9 0-1
Я хотел бы представить данные как распределение владения на основе различных категорий. Например:
sns.distplot(wk[(wk.Benefits=="M")&(wk.Status=="A")]['Tenure'],color = "blue", bins=20)
sns.distplot(wk[(wk.Benefits=="M")&(wk.Status=="T")]['Tenure'],color = "red", bins=20)
Но приведенные выше коды не могут распространяться на данные типа String, такие как Tenure. Даже график может дать изображение бара (даже не в хорошем порядке), он не может дать линию распределения, которая оказывается ValueError: не удалось преобразовать строку в число с плавающей точкой: '60 - '
Если я собираюсь использовать точные данные за месяц, то цифры на оси X будут очень переполнены.
Есть ли лучший способ интерпретировать это?