Перед кластеризацией я должен сделать анализ временных рядов? - PullRequest
0 голосов
/ 18 октября 2018

У меня есть вопрос.У меня много разных предметов, разных товаров компании (26000), и у меня есть количество продаж 52 недели 2017 года. Мне нужно сделать модель прогнозирования на будущее, поэтому я решил сделать кластер предметов.

Цель состоит в том, чтобы показать количество предметов, которые были проданы в течение 2017 года в аналогичном количестве, и для новой коллекции предметов я делаю классификацию на основе кластера и делаю конкретное прогнозирование модели для предметов.Я впервые использую машинное обучение, поэтому мне нужна помощь.

Нужно ли делать анализ корреляции, прежде чем я сделаю кластер?

Я могу создать метрику на основе корреляции, которую я вставил в свою кластерную функцию, например, метрику расстояния.

1 Ответ

0 голосов
/ 18 октября 2018

Кластеризация на данных временных рядов не может привести к результатам на необработанных данных.

Данные временных рядов относятся к трендам, а не к фактическим значениям.

Попробуйте преобразовать свои данные, чтобы отразить некоторые тенденции и сделатькластеризация.

Например, предположим, что ваши данные похожи на 5,10,45,23

Преобразуйте их в 0,1,1,0 ,(1 означает увеличение стоимости по сравнению с предыдущим).Тем самым вы можете кластеризовать элементы, которые увеличиваются или уменьшаются вместе.

Это всего лишь мнение, вам придется попробовать различные преобразования и посмотреть, что работает с вашими данными.https://datascience.stackexchange.com/ является подходящим местом, чтобы задать такие вопросы

...