Управление Excelsheet пандами или матплотлибами - PullRequest
0 голосов
/ 29 октября 2019

Я новичок в Python, поэтому я не знаю, какой метод лучше всего подходит для выполнения задачи, которую я должен выполнить.

По сути, у меня есть электронная таблица с моими данными;Дата, метка времени и 6 столбцов с различным количеством частиц в 6 различных размерах. Мне удалось прочитать лист с помощью панд, а затем построить его в виде линейного графика с библиотекой matplotlib.pyplot. Это все относительно просто.

Тем не менее, я хотел бы добавить больше линий на график, для каждого подсчета я хотел бы получить среднее значение за последние 1000 отсчетов.

Я не уверен,манипулировать набором данных пандами или, если есть другой, более эффективный способ сделать это. Я читал, что вы также можете сделать это с массивами numpy ... Но у меня нет опыта ни с одним из них.

Вот код, который у меня есть:

import pandas as pd
import matplotlib.pyplot as plt

dataset = "2019-10-09-08_DATA.XLS"

dataset_all = pd.read_excel(dataset, skiprows=6, usecols=(
   "Date", "Time", "0.3um", "0.5um", "1.0um", "2.0um", "5.0um", "10.0um"))

dataset_all.plot()

print(dataset_all)
plt.show()

Вот ссылкана электронную таблицу: https://drive.google.com/file/d/1GFU_wwt5KMuLkziQlEyWJMHrkV4Pta3k/view?usp=sharing

1 Ответ

0 голосов
/ 30 октября 2019

Я скачал ваш файл, и он тут же отобразился (на не очень быстрой машине). У меня есть файлы гораздо большего размера (более 500 МБ), которые я использую с пандами. Оптимизация не требуется, если у вас много-многократный размер данных.

Если рендеринг графика замедляется, вы также можете сгенерировать вывод файла, например PNG.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...