Предположим, у вас есть матрица (двумерный массив NumPy), в котором хранятся многомерные данные выборки. Правильно ли (по скорости и простоте использования) хранить данные, используя одну строку для каждого образца или один столбец для каждого? * Например 1005 *
array([[x1, y1, ...], [x2, y2, ...], ..., [xN, yN, ...]])
или
array([[x1, x2, ..., xN], [y1, y2, ..., yN], ...])
В MATLAB и Octave, безусловно, проще обрабатывать каждый образец как вектор column , но numpy не дает никаких указаний в любом случае.
Например. Вот как вы можете нормализовать набор сэмплов, если каждый хранится как вектор строки:
X - mean(X, axis = 0)
Но если вы храните их как векторы столбцов, вы должны написать
(X.T - mean(X, axis = 1)).T
Что совсем не так удобно.