Я пытаюсь реализовать алгоритм кластеризации документов k-средних в SageMaker. Несколько вопросов:
-Как я могу автоматизировать и оптимизировать количество сформированных кластеров?
-Какую наилучшую меру сходства текста использовать в этой ситуации?
-Есть какие-нибудь существующие реализации ноутбуков, на которые я могу сослаться?
Спасибо.