Как я могу найти значение с минимальным MSE с пустым массивом? - PullRequest
0 голосов
/ 03 марта 2019

Мои возможные значения:

0: [0 0 0 0]
1: [1 0 0 0]
2: [1 1 0 0]
3: [1 1 1 0]
4: [1 1 1 1]

У меня есть несколько значений:

[[0.9539342  0.84090066 0.46451256 0.09715253],
 [0.9923432  0.01231235 0.19491441 0.09715253]
 ....

Я хочу выяснить, какое из моих возможных значений ближе всего к моим новым значениям.В идеале я хочу избежать цикла for и задаться вопросом, есть ли какой-нибудь векторизованный способ поиска минимальной среднеквадратичной ошибки?

Я хочу, чтобы он возвращал массив, который выглядит следующим образом: [2, 1 ....

Ответы [ 3 ]

0 голосов
/ 03 марта 2019

Чистый NumPy:

val1 = np.array ([
   [0, 0, 0, 0],
   [1, 0, 0, 0],
   [1, 1, 0, 0],
   [1, 1, 1, 0],
   [1, 1, 1, 1]
  ])

print val1
val2 = np.array ([0.9539342, 0.84090066, 0.46451256, 0.09715253], float)
val3 = np.round(val2, 0)
print val3

print np.where((val1 == val3).all(axis=1)) # show a match on row 2 (array([2]),)
0 голосов
/ 03 марта 2019

Вы можете использовать np.argmin, чтобы получить наименьший индекс значения rmse, который можно рассчитать с помощью np.linalg.norm

import numpy as np
a = np.array([[0, 0, 0, 0], [1, 0, 0, 0], [1, 1, 0, 0],[1, 1, 1, 0], [1, 1, 1, 1]])
b = np.array([0.9539342, 0.84090066, 0.46451256, 0.09715253])
np.argmin(np.linalg.norm(a-b, axis=1))
#outputs 2 which corresponds to the value [1, 1, 0, 0]

Как упоминалось в редактировании, b может иметь несколько строк.Оператор хочет избежать цикла for, но я не могу найти способ избежать цикла for.Вот способ компиляции списка, но может быть лучший способ

[np.argmin(np.linalg.norm(a-i, axis=1)) for i in b] 
#Outputs [2, 1]
0 голосов
/ 03 марта 2019

Давайте предположим, что ваши входные данные - словарь.Затем вы можете использовать NumPy для векторизованного решения.Сначала вы преобразуете свои входные списки в массив NumPy и используете аргумент axis=1, чтобы получить RMSE.

# Input data
dicts = {0: [0, 0, 0, 0], 1: [1, 0, 0, 0], 2: [1, 1, 0, 0], 3: [1, 1, 1, 0],4: [1, 1, 1, 1]}
new_value = np.array([0.9539342, 0.84090066, 0.46451256, 0.09715253])

# Convert values to array
values = np.array(list(dicts.values()))

# Compute the RMSE and get the index for the least RMSE 
rmse = np.mean((values-new_value)**2, axis=1)**0.5
index = np.argmin(rmse)    

print ("The closest value is %s" %(values[index]))
# The closest value is [1 1 0 0]
...