Как я могу предоставить воспроизводимую копию моего существующего DataFrame? - PullRequest
0 голосов
/ 19 сентября 2018

2018-09-18_reproducible_dataframe.ipynb

Это может показаться очевидным вопросом.Тем не менее, многие пользователи, задающие вопросы о пандах, новички и неопытны. Как создать минимальный, полный и проверяемый пример , который объясняет что, но не совсем как.

Например, как человек, задающий вопрос.вопрос, который мне может понадобиться:

import pandas as pd

df = pd.read_csv('flavors_of_cacao.csv')

, за которым следует какой-то другой код, который выдает ошибку или не дает желаемого результата

Вещи, которые следует указывать при запросевопрос о переполнении стека.

  • Хорошо написанный связный вопрос
  • Код, который выдает ошибку
  • Стек ошибок
  • Потенциально, ожидаемыйрезультат некоторого кода
  • Данные в удобной для использования форме

Ответы [ 2 ]

0 голосов
/ 19 сентября 2018

если вы сделаете что-то вроде print(df.head(20)) и вставите вывод в формате кода, тогда мы можем использовать pd.read_clipboard() для загрузки данных в информационный кадр.Этот подход работает для подавляющего большинства вопросов, размещенных под тегом pandas, но с треском проваливается для вопросов, касающихся multiindex

0 голосов
/ 19 сентября 2018

Самый быстрый способ предоставления образцов данных из pandas DataFrame

Существует несколько способов ответить на этот вопрос.Однако этот ответ не является исчерпывающим решением.Это самый простой из возможных методов.Любопытно, что в Stack Overflow есть и другие более подробные решения.

  1. Предоставьте ссылку на общий набор данных (может быть, на GitHub или общий файл в Google).Это особенно полезно, если это большой набор данных и целью является оптимизация какого-либо метода.Недостатком является то, что в будущем данные могут быть недоступны, что снижает выгоду от публикации.
  2. Обеспечивает вывод df.head(10).to_clipboard(sep=',', index=False)

Код

import pandas as pd

df = pd.read_csv('flavors_of_cacao.csv')

Обеспечить вывод pandas.DataFrame.to_clipboard

df.head(10).to_clipboard(sep=',', index=False)

Если у вас многоиндексный DataFrameили индекс, отличный от 0 ... n, используйте index=True и укажите в своем вопросе примечание о том, какие столбцы являются индексом.

Примечание: когда предыдущийстрока кода выполнена, вывод не появится.Результат кода теперь находится в буфере обмена.

вставьте буфер обмена в переполнение стека

"Company 
(Maker-if known)","Specific Bean Origin
or Bar Name",REF,"Review
Date","Cocoa
Percent","Company
Location",Rating,"Bean
Type","Broad Bean
Origin"
A. Morin,Agua Grande,1876,2016,63%,France,3.75, ,Sao Tome
A. Morin,Kpime,1676,2015,70%,France,2.75, ,Togo
A. Morin,Atsane,1676,2015,70%,France,3.0, ,Togo
A. Morin,Akata,1680,2015,70%,France,3.5, ,Togo
A. Morin,Quilla,1704,2015,70%,France,3.5, ,Peru
A. Morin,Carenero,1315,2014,70%,France,2.75,Criollo,Venezuela
A. Morin,Cuba,1315,2014,70%,France,3.5, ,Cuba
A. Morin,Sur del Lago,1315,2014,70%,France,3.5,Criollo,Venezuela
A. Morin,Puerto Cabello,1319,2014,70%,France,3.75,Criollo,Venezuela
A. Morin,Pablino,1319,2014,70%,France,4.0, ,Peru

, которое можно скопировать вбуфер обмена и затем:

pd.read_clipboard(sep=',')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...