R - Категориальное распределение и категориальная сегментация - PullRequest
0 голосов
/ 21 июня 2020

У меня есть следующие образцы данных (10000 строк):

Year    First Name  County  Sex Count
2012    DOMINIC CAYUGA  M   6
2012    ADDISON ONONDAGA    F   14
2012    JULIA   ONONDAGA    F   15
2012    WILLIAM WESTCHESTER M   41

, и я хотел бы понять, есть ли какие-либо корреляции в именах и групповых округах с аналогичным распределением имен для детей.

Кроме того, я хотел бы провести категориальную сегментацию, чтобы найти однородные и неоднородные кластеры.

Возможно ли это?

заранее спасибо, Милс

...