Вот первые 10 столбцов моего фрейма данных:
import pandas as pd
df = pd.DataFrame({
'0': [373.60],
'1': [442.83],
'2': [259.21],
'3': [293.05],
'4': [332.79],
'5': [360.03],
'6': [676.55],
'7': [481.67],
'8': [486.59],
'9': [561.65],
'10': [491.75]})
И так далее, фактически мой df содержит 100000 столбцов. Минимальное значение равно 109,59, максимальное значение равно 1703,35.
Я хочу разделить df на заданные диапазоны c длиной 3,98, а затем определить диапазон, содержащий максимальное количество значений. Я имею в виду, что диапазоны должны быть такими:
# converting df to array
df_array = np.array(df)
# defining ranges like:
range_length=3.98
range_1 = df_array.min() + range_length
range_2 = range_1 + range_lenght
...
range_n = df_array.max() - range_n-1
А потом я вижу, что в некотором range_150 содержится около 1200 значений, что является наиболее частым диапазоном распределения, который мне нужен.
И вот я Мне нужно определить индекс каждого значения из этого диапазона в моем DF ..
На самом деле не имеет ни малейшего представления, как это сделать. Похоже, нужно создать несколько функций. Может кто-нибудь помочь, пожалуйста?