Простой способ распечатать серию данных / фрейм данных? - PullRequest
1 голос
/ 05 апреля 2020

В pandas есть много методов, таких как head, tail, lo c, ilo c, которые можно использовать для просмотра данных внутри, но всякий раз, когда я вызываю один из этих методов в dask, все get is:

Dask DataFrame Structure:
              Close
npartitions=1
               bool
                ...
Dask Name: try_loc, 9 tasks

независимо от того, вызываю ли я ранее .compute (). Как просмотреть данные внутри кадра данных / серии dask?

Я использую код Visual Studio 1.38.1, python 3.7, dask 2.13.0

1 Ответ

1 голос
/ 05 апреля 2020

head, tail и compute возвращают нормальные Pandas кадры данных, которые должны выводиться на экран привычным способом. Вот простой пример:

In [1]: import dask                                                             

In [2]: df = dask.datasets.timeseries()                                         

In [3]: df                                                                      
Out[3]: 
Dask DataFrame Structure:
                   id    name        x        y
npartitions=30                                 
2000-01-01      int64  object  float64  float64
2000-01-02        ...     ...      ...      ...
...               ...     ...      ...      ...
2000-01-30        ...     ...      ...      ...
2000-01-31        ...     ...      ...      ...
Dask Name: make-timeseries, 30 tasks

In [4]: df.head()                                                               
Out[4]: 
                       id     name         x         y
timestamp                                             
2000-01-01 00:00:00  1014  Michael  0.326006 -0.247279
2000-01-01 00:00:01  1001    Laura  0.429982 -0.545960
2000-01-01 00:00:02  1003      Bob -0.454010  0.096530
2000-01-01 00:00:03   964    Wendy  0.939114  0.826197
2000-01-01 00:00:04  1008   Xavier  0.035316  0.793430
...