Удобный способ для образца кусков в Пандах? - PullRequest
0 голосов
/ 15 мая 2018

У меня есть данные, которые отслеживают группу людей с течением времени. Для небольшого примера это выглядит примерно так:

ID    TIME   HEIGHT
0     0      10.2
0     1      3.3
0     2      2.1
1     0      11.3
1     1      8.6
1     2      9.1
2     0      10.0
2     1      35.0
2     2      4.1
.
.
.
100   0      1.0
100   1      3.0
100   2      9.0

Где, для иллюстрации, ID относится к конкретному человеку. Таким образом, этот график TIME на оси x и HEIGHT на оси y для всех значений ID=0 дает нам изменение высоты лица 0 s.

Я хочу построить случайную выборку этих людей и построить их. Так, например, я хочу построить график изменения высоты с течением времени для 3 человек. Однако применение обычного df.sample(3) не всегда гарантирует, что я получу все время для конкретного человека, вместо этого он выберет случайным образом 3 строки и нанесет их на график. Есть ли в pandas предпочтительный / удобный способ отбора случайных групп?

Многие подобные вопросы one , похоже, касаются выборки из каждой группы, что я не хочу делать.

1 Ответ

0 голосов
/ 15 мая 2018

Вы хотите построить 'TIME' по оси X, затем получить прямоугольный фрейм данных с 'TIME' в качестве индекса и 'ID' в качестве столбцов. Оттуда используйте sample с axis=1 для выборки столбцов и оставьте индекс без изменений.

df.set_index(['TIME', 'ID']).HEIGHT.unstack().sample(3, axis=1).plot()

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...