Операция между двумя двумерными массивами - PullRequest
0 голосов
/ 24 октября 2019

Я пытаюсь работать с двумя двумерными массивами, чтобы каждая строка моего первого массива работала со всеми строками второго массива.

Array1

test[] = [[0.54131721 0.52305685 0.42921551, 0.37434461 0.52591475 0.36184407]
 [0.53091097 0.3000469  0.39346106, 0.29261769 0.3806552  0.33904193]
 [0.29331853 0.44518117 0.41390863, 0.2510257  0.50481932 0.43607184]]

Array2

train[] =[[0.5301304,  0.62645837, 0.44524917, 0.40806674 0.46013734 0.61033772]
 [0.43333892 0.46062429 0.56937923, 0.6451305  0.33103777 0.35859095]
 [0.60879428 0.72451976 0.2661216, 0.38850336 0.41685737 0.57226228]]

Вот как я сохраняю оба массива:

import numpy as np
trainingData = np.genfromtxt('trainingData.csv', delimiter=',')
inTraining = trainingData[:, :-1]
print(inTraining)
testData = np.genfromtxt('testData.csv', delimiter=',')
inTest = testData[:, :-1]
print(inTest)

Это то, что я пробовал, что, кажется, даже не близко:

def euclideanDistance( c1, c2):
        d1 = inTraining[]
        d2 = inTest[]
        a = math.sqrt( (d1[0]-d2[0])**2 + (d1[1]-d2[1])**2 )
        print(a)
        return a

Ожидаемый результат должен быть как первый список, содержащий результат операции между:

[0.54131721 0.52305685 0.42921551, 0.37434461 0.52591475 0.36184407] and [[0.5301304,  0.62645837, 0.44524917, 0.40806674 0.46013734 0.61033772]
 [0.43333892 0.46062429 0.56937923, 0.6451305  0.33103777 0.35859095]
 [0.60879428 0.72451976 0.2661216, 0.38850336 0.41685737 0.57226228]]

1 Ответ

1 голос
/ 24 октября 2019

IIUC, вы хотите вычислить расстояние между каждой строкой test до каждой строки train. Это distance_matrix:

from scipy.spatial import distance_matrix
distance_matrix(test,train)

Вывод:

array([[0.27979822, 0.38277359, 0.35792442],
       [0.44997152, 0.43972939, 0.51706358],
       [0.3833412 , 0.48532177, 0.49455157]])

Если вы хотите использовать только код с кодом, вы можете посмотреть код distance_matrix, чтобы увидеть, что происходит. По сути, это вещательное действие:

def dist_mat(x,y):
    return np.sqrt(np.sum((x- y[:,None])**2, axis=-1))

dist_mat(train,test)

Вывод:

array([[0.27979822, 0.38277359, 0.35792442],
       [0.44997152, 0.43972939, 0.51706358],
       [0.3833412 , 0.48532177, 0.49455157]])
...