У меня есть следующие образцы данных (10000 строк):
Year First Name County Sex Count
2012 DOMINIC CAYUGA M 6
2012 ADDISON ONONDAGA F 14
2012 JULIA ONONDAGA F 15
2012 WILLIAM WESTCHESTER M 41
, и я хотел бы понять, есть ли какие-либо корреляции в именах и групповых округах с аналогичным распределением имен для детей.
Кроме того, я хотел бы провести категориальную сегментацию, чтобы найти однородные и неоднородные кластеры.
Возможно ли это?
заранее спасибо, Милс