У меня есть две категориальные переменные A и B, для которых я собираю множество кортежей вида (a, b).Я хочу использовать pd.crosstab для получения нормализованного перекрестного табулирования, где я вижу, как соотносятся значения A и B.
Обычно я бы разбил свой набор данных пар (a, b) на массив значенийи массив значений b и передать их в pd.crosstab в качестве индекса и столбцов соответственно.
Теперь в этом случае у меня действительно много кортежей, поэтому я храню их как (a, b,частота) утраивается.Как я могу использовать pd.crosstab в этом формате, не разбивая тройки на пары в памяти?