Ответы Text Mining с очень разными длинами ответов - PullRequest
0 голосов
/ 04 января 2019

У меня есть набор ответов, где людей просили ответить на ряд вопросов.Для обработки есть только один столбец текстовых данных.

Моя задача заключается в том, чтобы:только очень немногие респонденты написали длинные тексты, которые мне было легко обработать, и я понял из этого.Большинство других ответов часто бывают очень короткими, такими как «Отчасти», «Да», «Нет», «Большая степень».Это также было невозможно для обычного масштабирования, потому что в нем нет логического порядка.

Я смог использовать более длинные текстовые ответы, чтобы получить представление о чувствах, извлечь ключевые слова и фразы и применить машинное обучениетакие как грабли и PMI.Я использовал библиотеку UDPIPE с R.

Однако, для более коротких ответов «в несколько слов», мне действительно трудно понять их.

Существует ли какая-либо другая техника машинного обучения, возможная стекущая проблема у меня есть?Или мне нужно попробовать какую-нибудь технику НЛП?

...