У меня есть список из нескольких десятков атрибутов продукта, которые интересуют людей, например
- Финансирование
- Качество изготовления
- Прочность
- Опыт продаж
и несколько миллионов заявлений клиентов в свободном тексте о продукте, например
«Финансирование было легким, но жилье хрупкое.»
Я хотел бы оценить каждое утверждение в свободном тексте с точки зрения того, насколько сильно оно относится к каждому из атрибутов и является ли это положительной или отрицательной ассоциацией.
В данном примере будет сильная положительная связь с Financing
и сильная отрицательная связь с Manufacturing quality
.
Такое чувство, что проблема такого рода, вероятно, является областью программирования на естественном языке (НЛП). Однако я потратил несколько часов на чтение таких вещей, как OpenNLP и NLTK, и обнаружил, что существует так много терминов, относящихся к конкретным доменам, что я не могу понять, на чем сосредоточиться, чтобы решить эту конкретную проблему.
Итак, мой вопрос из трех частей:
- Является ли НЛП правильным маршрутом для решения этого класса проблем?
- Какому аспекту НЛП я должен сосредоточиться на обучении для этой конкретной проблемы?
- Есть ли альтернативы, которые я не рассматривал?