Создание больших наборов данных с пандами - PullRequest
0 голосов
/ 05 июля 2018

Я конвертирую набор данных осциллографа с миллионами значений в панду DataFrame. Следующий шаг - построить его. Но на моем достаточно мощном компьютере Matplotlib нужно ~ 50 секунд, чтобы построить DataFrame.

import pandas as pd
import matplotlib.pyplot as plt
import readTrc    

datX, datY, m = readTrc.readTrc('C220180104_ch2_UHF00000.trc')

srx, sry = pd.Series(datX), pd.Series(datY)
df = pd.concat([srx, sry], axis = 1)
df.set_index(0, inplace = True)

df.plot(grid = 1)
plt.show()

Теперь я обнаружил, что есть способ сделать Matplotlib быстрее с большими наборами данных, используя Agg.

import matplotlib
matplotlib.use('Agg')
import pandas as pd
import matplotlib.pyplot as plt
import readTrc

datX, datY, m = readTrc.readTrc('C220180104_ch2_UHF00000.trc')

srx, sry = pd.Series(datX), pd.Series(datY)
df = pd.concat([srx, sry], axis = 1)
df.set_index(0, inplace = True)

df.plot(grid = 1)
plt.show()

К сожалению, сюжет не показан. Процесс обработки графика занимает ~ 5 секунд (большое улучшение), но график не отображается. Этот метод не совместим с пандами?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...