Допустим, у меня есть текстовая расшифровка диалога в течение периода приблизительно.1 час.Я хочу знать, какие слова происходят в непосредственной близости друг к другу.Какой тип статистического метода я бы использовал, чтобы определить, какие слова объединены в кластеры и насколько близко они находятся друг от друга?
Я подозреваю, что какой-то кластерный анализ или PCA.