Я работаю над набором текстовых данных, содержащим сообщения от пользователей на веб-сайте. Пожалуйста, проверьте изображение в ссылке, так как стек не позволяет мне публиковать это изображение напрямую. датафрейм первых пяти строк
Читая эти сообщения, я хочу выяснить намерения пользователей, являются ли они покупателем, продавцом или нейтральным. Я пробовал тематическое моделирование, используя LDA и NMF, но это не дает мне ответов. Поскольку я получаю очень разные темы, и я не могу найти способ связать это с продавцом покупателя или нейтральным. И я не могу вручную пометить эти данные, потому что это огромный набор данных, содержащий 200 000 тысяч строк. Итак, какую технику или алгоритм я могу использовать для решения этой проблемы.