Привет, ученые данных.
Я написал эту функцию для загрузки моих данных в виде фрагментов, она работает нормально и дает мне форму моих данных, но когда я пытаюсь присвоить их переменной, чтобы яможет быть в состоянии очистить мои данные и работать с ними, это показывает, что это не тип
def show(df):
start = time()
c=0
for chuck in pd.read_csv('../input/{}.csv'.format(df), chunksize=50000):
if c==0:
df=chuck
c+=1
else:
df=df.append(chuck, ignore_index=True)
c+=1
print (c)
print('used {:.2f} s'.format(time()-start))
print(df.shape)
df.head()
Мои данные изначально имеют 307511 строк и 212 столбцов.Существуют и другие наборы данных, которые мне все еще приходится загружать миллионами строк.Моя оперативная память не может обработать такой объем данных, поэтому я запрашиваю помощь по этому
. Я также пробовал этот способ загрузки данных, но не могу получить все свои данные, но определенную их часть.Я хочу использовать все свои данные, когда я объединяю и подгоняю свои данные
df = pd.read_csv('../input/application_train.csv', iterator=True, chunksize=10**6, engine='python')
Это работает, но я не получаю из этого все свои данные
df = df.get_chunk(300000)