У меня есть папка, которая содержит много CSV (100+), и каждый CSV содержит много строк.
Я использую следующий код для загрузки CSV во фрейм данных, но это занимает достаточно много времени,Какой самый быстрый способ загрузить эти данные?
import os
import glob
import sqlite3
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
path = '/Users/DATA'
all_files = glob.glob(os.path.join(path,'*.csv'))
np_array_list = []
for file_ in all_files:
df = pd.read_csv(file_, index_col = None, header = 0, low_memory = False,
usecols = [1, 6, 7, 8, 9, 10, 11, 14, 16, 17, 22, 23])
np_array_list.append(df.as_matrix())
comb_np_array = np.vstack(np_array_list)
big_data = pd.DataFrame(comb_np_array)