1) Как бы классифицировать каждую запись без заданных категорий.
Вы бы этого не сделали.Вместо этого вы будете использовать какой-то алгоритм уменьшения размерности для функций данных, которые будут им представлены в 2-х измерениях, угадать количество «естественных» кластеров, а затем запустить алгоритм кластеризации.
2) Как это сделатьэто, если вам дали заранее определенные категории, такие как «ресторан», «развлечения» и т. д.
Вы бы вручную пометили их несколько, а затем обучили этому классификатору и посмотрите, насколько хорошо он работает собычный механизм точности / F1, перекрестная проверка и т. д. Или вы бы проверили, хорошо ли алгоритм кластеризации улавливает эти категории, но тогда вам все еще нужны некоторые помеченные данные.