Как начальные точки kmeans работают в BigQuery ML? - PullRequest
0 голосов
/ 18 июня 2019

Я использую BigQuery для машинного обучения, в частности, метод kmeans для немеченых данных, где я пытаюсь найти кластеры.Я хотел бы знать, если кто-то обнаружил, как BQ ML инициирует центроиды?

Я уже пробовал искать документацию, но ничего нет или я не смог найти.

CREATE MODEL `projet.dataset.model_name`
    OPTIONS(
        model_type="kmeans",
        num_clusters=3,
        distance_type="euclidean",
    early_stop=TRUE,
    max_iterations=20,
    STANDARDIZE_FEATURES=TRUE)
    AS
    (SELECT *   FROM `project.dataset.sample_date_to_train`  
    )

Результаты немного отличаются каждый раз, когда я бегал.У кого-нибудь есть опыт работы с этим предметом?

1 Ответ

0 голосов
/ 27 июня 2019

Если бы мне пришлось угадывать, он, вероятно, использует логику, аналогичную TensorFlow (BQML может использовать TF под капотом, как он есть). Случайное разбиение, по-видимому, является значением по умолчанию TensorFlow, так что это мое предположение.

...