Я хочу сгруппировать df по столбцу col_2
, который содержит в основном integers
, но некоторые ячейки содержат диапазон целых чисел . В моем примере из реальной жизни каждое уникальное целое число представляет определенный серийный номер собранной детали. Каждая строка в кадре данных представляет одну часть, которая выделяется собранной части на col_2
. Некоторые детали могут быть отнесены только к собранной детали с заданной неопределенностью (диапазоном).
Ожидаемый результат будет одна одна группа для каждого ссылочного целого числа (собранная часть S / N). Например, запись col_1 = c должна быть выделена для обеих групп, где col_2 = 1 и col_2 = 2.
df = pd.DataFrame( {'col_1': ['a', 'b', 'c', 'd', 'e', 'f'],
'col_2': [1, 2, range(1,3), 3,range(2,5),5]})
col_1 col_2
0 a 1
1 b 2
2 c (1, 2)
3 d 3
4 e (2, 3, 4)
5 f 5
print(df.groupby(['col_2']).groups)
Приведенный выше код выдает ошибку:
TypeError: '<' не поддерживается между экземплярами 'range' и 'int' </p>