Ошибка повторной выборки панд в AWS Ubuntu? - PullRequest
0 голосов
/ 27 марта 2019

AWS Ubuntu 18.04

Когда я запускаю следующую команду на моей локальной машине, она работает без проблем. Однако на AWS это дает ошибку памяти. Я видел кучу вопросов / ответов, но ни у одного из них не было подходящего решения.

import os
import sqlite3
import pandas as pd
import datetime

loc_tick = '/home/xxx/tick_data'
    os.chdir(loc_tick)

# Reqd sql db
conn = sqlite3.connect('tick.db', detect_types=sqlite3.PARSE_DECLTYPES, timeout=20, isolation_level=None)
m1df = pd.read_sql('select * from usdinrtick order by timestamp DESC limit 100000', conn)
#if there is a better way to select data while making sure I get the last 400-ish minutes I am all ears

m1df.set_index('timestamp', drop=True, inplace=True)

# convert to min data

m1df = m1df.resample('60S').ohlc()

Я получаю следующее

Traceback (последний вызов был последним): Файл "", строка 1, в Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/resample.py", строка 865, в файле вернуть self._downsample (_method) Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/resample.py", строка 1020, в _downsample self.grouper, axis = self.axis) .aggregate (как, ** kwargs) Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/groupby/generic.py", строка 1315, в совокупности return super (DataFrameGroupBy, self) .aggregate (arg, * args, ** kwargs) Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/groupby>/generic.py", строка 186, в совокупности результат, как = self._aggregate (arg, _level = _level, * args, ** kwargs) Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/base.py", строка 356, в _aggregate ** kwargs), нет Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/base.py",> строка 312, в _try_aggregate_string_function вернуть f (* args, ** kwargs) Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/groupby/groupby.py", строка 1319, в ohlc лямбда x: x._cython_agg_general ('ohlc')) Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/groupby/generic.py", строка 1492, в _apply_to_column_groupbys keys = self._selected_obj.columns, axis = 1) Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/reshape/concat.py", строка 228, в concat копировать = копировать, сортировать = сортировать) Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/reshape/concat.py", строка 259, в init objs = список (objs) Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/groupby/generic.py", строка 1490, в (func (col_groupby) для _, col_groupby Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/groupby/groupby.py", строка 1319, в лямбда x: x._cython_agg_general ('ohlc')) Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/groupby/groupby.py", строка 832, в _cython_agg_general min_count = min_count) Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/groupby/ops.py", строка 548, в совокупности min_count = min_count) Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/groupby/ops.py", строка 495, в _cython_operation ярлыки, _, _ = self.group_info Файл "pandas / _libs / properties.pyx", строка 36, в> pandas._libs.properties.CachedProperty. get Файл "/home/sid/.local/lib/python3.6/site-packages/pandas/core/groupby/ops.py", строка 731, в group_info rep = np.diff (np.r_ [0, self.bins]) Файл "/home/sid/.local/lib/python3.6/site-packages/numpy/lib/index_tricks.py", строка 404, в getitem res = self.concatenate (кортеж (objs), ось = ось) MemoryError

Часть, в которой этот код работает без проблем на локальном компьютере и продолжает выдавать эту ошибку в AWS Ubuntu 18.04, очень смутила меня и не смогла понять, как именно отладить / устранить неполадки.

ТИА

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...