Это вопрос высокого уровня, поэтому, пожалуйста, потерпите меня.
У меня есть дата в несколько десятков миллионов баллов, на которой я хочу запустить tSNE.Поскольку это действительно вычислительно дорогой алгоритм, я хотел бы сначала уменьшить выборку этого набора данных, запустить tSNE для этого подмножества, а затем повысить выборку (кое-как), чтобы данные, не относящиеся к tSNE, могли быть нанесены на карту tSNE.
Я думаю, что я бы разделил набор данных на несколько частей, запустил tSNE для каждой части, используя одно и то же начальное число, чтобы они были выровнены.
Это возможно или есть лучшие способы сделать это?