У меня есть данные рекламных объявлений, размещенных на бывшем в употреблении сайте по продаже бывших в употреблении смартфонов.Каждое объявление описывает продукт, который продается.Я хочу знать, какие параметры чаще всего описывают продавцы.Например: марка, модель, цвет, объем памяти, ...
С помощью текстового анализа всего текста из рекламных объявлений я хотел бы объединить похожие слова в одну категорию.Например: черный, белый, красный, ... должны быть связаны друг с другом, поскольку все они описывают цвет телефона.
Можно ли это сделать с помощью кластеризации или категоризации, и какие алгоритмы интеллектуального анализа текста оснащены для этого?