Я работаю над набором данных отзывов.Проблема состоит в том, чтобы извлечь из обзоров важные (сколько раз проверенные одинаковые функции) положительные и отрицательные характеристики этого конкретного продукта.
Пример: some xyz car
положительный: Большой пробег, красивый, просторный и т. Д.
Отрицательный: Плохая мощность, плохая производительность, проблемы с программным обеспечением и т. Д.
Суть в том, чтобы извлечь самые лучшие и худшие вещи опродукт!
До сих пор я использовал gocim's doc2vec, чтобы найти лучшее положительное и отрицательное предложение.Результаты не так хороши, и потому что он получает похожие предложения со структурой, а не похожие перья, которые он держит.