Я использую Python 3.6.2 и numpy в Windows.
У меня есть два массива,
целочисленный массив [I1, I2, I3, I4]
массив значений с плавающей точкой [VI1, VI2, VI3, Vi4]
Массивы одинаковой длины
Целые числа в первом массиве могут повторяться
Значения вВторой массив связан с целым числом в том же месте в первом массиве.
Для каждого уникального целого числа в первом массиве мне нужно найти все вхождения этого целого числа в первом массиве и затем вычислитьсреднее значение всех значений в соответствующем месте во втором массиве.
Дано массив индекса [1, 5, 7, 5, 9, 7, 4]
и массив значений [9, 4, 8, 7, 2, 8, 6]
1, 9 и 4 встречаются один раз в массиве индексов и связаны со значениями 9, 2 и 6, которые также являются средними значениями для этих индексов.
5 появляется дважды в массиве индекса со связанными значениями 4 и 7 - в среднем 5,5 7 появляется дважды в массиве индексас соответствующими значениями 8 и 8 - в среднем 8,0
Массивы могут быть очень большими - до 100 млн.
Конечно, это грубая сила, но есть быстрый иэффективный способ памяти для достижения этого в Python / numpy?
Заранее спасибо,
Doug