У меня есть следующий образец df от 20-ти метровых спортсменов, занимающихся спринтом, с разделенным временем. Они делают 3 испытания. Я хочу создать новые столбцы для каждого разделения, которые усредняют их два самых быстрых испытания (отбросьте самое медленное испытание).
Вот пример df:
Athlete 0_10m_1 10_20m_1 0_20m_1 0_10m_2 10_20m_2 0_20m_2 0_10m_3 10_20m_3 0_20m_3
1 Athlete 1 2.005 1.320 3.325 1.904 1.306 3.210 1.993 1.316 3.309
2 Athlete 2 1.967 1.383 3.350 1.931 1.391 3.322 2.005 1.399 3.404
3 Athlete 3 2.008 1.381 3.389 2.074 1.365 3.439 2.047 1.408 3.455
4 Athlete 4 1.817 1.286 3.103 1.924 1.285 3.209 NA NA NA
Конечным результатом будет 3 новых столбца со средними значениями 2 самых быстрых испытаний (на основе времени 0_20 м) ("Avg_0_10m" "," Avg_10_20m ", Avg_0_20m"). В идеале решение достаточно надежно для обработки значений NA, поскольку в наборе данных будут некоторые.
Есть предложения о том, как к этому подойти? Я не уверен, как это сделать быть в состоянии отфильтровать самое медленное испытание 0_20 м с соответствующими временами разделения и усреднить другие испытания.