Это не двоичные данные. Это двоичное изображение, хранящееся в виде строки, где пиксели представлены либо 0
(черный), либо 1
(белый).
Чтобы упростить задачу, давайте конвертируем ваши данные в 32 x 32numpy array
и визуализируйте его.
Преобразование train_set
в numpy array
train_img = {label: [np.uint8([*sample[0]]).reshape(32, 32)
for sample in samples]
for label, samples in train_set.items()}
Преобразование test_set
вnumpy array
test_img = np.uint8([*test_set[0]]).reshape(32, 32)
С этой точки зрения вычисление евклидова расстояния с использованием numpy
довольно просто с использованием numpy.linalg.norm
. Например:
In [5]: np.linalg.norm(test_img - train_img[0][0])
Out[5]: 2984.7336564591487
In [6]: np.linalg.norm(test_img - train_img[0][1])
Out[6]: 3459.016189612301
In [7]: np.linalg.norm(test_img - train_img[1][0])
Out[7]: 1691.5064291926294
In [8]: np.linalg.norm(test_img - train_img[1][1])
Out[8]: 2650.0669802855928
Полный код этого ответа
In [1]: import numpy as np
In [2]: train_set = {
...: 0: [


...: ],
...: 1: [


...: ]
...: }
...:
...: test_set
...:
In [3]: train_img = {label: [np.uint8([*sample[0]]).reshape(32, 32)
...: for sample in samples]
...: for label, samples in train_set.items()}
In [4]: test_img = np.uint8([*test_set[0]]).reshape(32, 32)
In [5]: np.linalg.norm(test_img - train_img[0][0])
Out[5]: 2984.7336564591487
In [6]: np.linalg.norm(test_img - train_img[0][1])
Out[6]: 3459.016189612301
In [7]: np.linalg.norm(test_img - train_img[1][0])
Out[7]: 1691.5064291926294
In [8]: np.linalg.norm(test_img - train_img[1][1])
Out[8]: 2650.0669802855928