добавлять без перезапуска массива каждый раз с начала - PullRequest
0 голосов
/ 21 июня 2020

У меня есть этот код:

import pandas as pd
import numpy as np

data = np.random.rand(50,4)

df = pd.DataFrame(data)

# LOOPING BY CHUNKS, STORING EACH CHUNK IN A NP ARRAY INSIDE A LIST
ix = 0
chunk = 10
arrays = []
for iy in range(chunk, len(df)+chunk, chunk):
    arrays.append(df.iloc[ix:iy])
    ix = iy
    print(arrays)

Проблема в том, что когда я печатаю массивы, он каждый раз запускается с начала, когда мне нужно, чтобы он запускал следующий массив, на котором остановился предыдущий. Чтобы уточнить, в этом примере у меня есть 1 массив с 10 строками, затем первый массив снова печатается со следующими 10 строками, затем печатаются оба и добавляется следующий массив et c ... Я бы хотел избавиться части повторения (не только в печати, но и в l oop в целом), но не мог найти, как это сделать.

1 Ответ

1 голос
/ 21 июня 2020

Вы почти у цели, просто перепутали переменные, чтобы использовать их для подмножества данных. Попробуйте что-нибудь вроде этого:

# LOOPING BY CHUNKS, STORING EACH CHUNK IN A NP ARRAY INSIDE A LIST
ix = 0
chunk = 10
arrays = []
for x in range(0, len(df), chunk):
    array = df.iloc[x: x+chunk]
    arrays.append(array)
    print(array)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...