Python, откуда взяты данные для подсказок в разделе Plotly? - PullRequest
0 голосов
/ 09 января 2020
import plotly.express as px
tips = px.data.tips()
tips
px.histogram(tips, x="total_bill", y="tip", histfunc="sum", color="smoker")

всего несколько строк, и все эти данные уже есть в «подсказках», я очень смущен, откуда взялись эти цифры? Большое спасибо советы

Out[125]: 
     total_bill   tip     sex smoker   day    time  size
0         16.99  1.01  Female     No   Sun  Dinner     2
1         10.34  1.66    Male     No   Sun  Dinner     3
2         21.01  3.50    Male     No   Sun  Dinner     3
3         23.68  3.31    Male     No   Sun  Dinner     2
4         24.59  3.61  Female     No   Sun  Dinner     4
..          ...   ...     ...    ...   ...     ...   ...
239       29.03  5.92    Male     No   Sat  Dinner     3
240       27.18  2.00  Female    Yes   Sat  Dinner     2
241       22.67  2.00    Male    Yes   Sat  Dinner     2
242       17.82  1.75    Male     No   Sat  Dinner     2
243       18.78  3.00  Female     No  Thur  Dinner     2

[244 rows x 7 columns]

Ответы [ 2 ]

0 голосов
/ 09 января 2020

Используя

import plotly.express as px

print(px.data.__file__)

, вы можете увидеть путь к исходному коду и проверить его.

Копая исходный код, я обнаружил, что на Linux данные находятся в папке

/usr/local/lib/python3.7/dist-packages/plotly/package_data/datasets/

как .csv файлы, сжатые в .gz файлы, так что pandas.read_csv() может прочитать его без проблем.
И tips() использует pandas.read_csv() для чтения.


Вы может отображать другие функции в px.data, который читает наборы данных, используя dir()

import plotly.express as px

for name in dir(px.data):
    if '__' not in name:
        print(name)

Результат

absolute_import
carshare
election
gapminder
iris
tips
wind

Вероятно, все они (кроме absolute_import) являются функциями, которые читают некоторые .gz файл с данными.

print(px.data.carshare())
print(px.data.election())
print(px.data.gapminder())
print(px.data.iris())
print(px.data.tips())
print(px.data.wind())
0 голосов
/ 09 января 2020

Есть несколько небольших наборов данных, которые вы можете импортировать из графика. express.

Когда вы пишете tips = px.data.tips () Это импортирует эти данные

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...