Как распределить данные по строковому типу в Python? - PullRequest
1 голос
/ 20 ноября 2019

У меня есть такой набор данных:

EmployeeID    BenefitsType    Status    YearsInJob   Tenure
000001          M              A            3.1        3-
000002          O              T            2.9        2-3
000003          N              A            5.1        3- 
000004          B              A            0.9        0-1

Я хотел бы представить данные как распределение владения на основе различных категорий. Например:

sns.distplot(wk[(wk.Benefits=="M")&(wk.Status=="A")]['Tenure'],color = "blue", bins=20)
sns.distplot(wk[(wk.Benefits=="M")&(wk.Status=="T")]['Tenure'],color = "red", bins=20)

Но приведенные выше коды не могут распространяться на данные типа String, такие как Tenure. Даже график может дать изображение бара (даже не в хорошем порядке), он не может дать линию распределения, которая оказывается ValueError: не удалось преобразовать строку в число с плавающей точкой: '60 - 'enter image description here

Если я собираюсь использовать точные данные за месяц, то цифры на оси X будут очень переполнены. enter image description here

Есть ли лучший способ интерпретировать это?

...