Новичок в НЛП - PullRequest
       12

Новичок в НЛП

0 голосов
/ 22 февраля 2019

У меня есть лист Excel, где присутствуют 3 столбца x1, x2, x3.x1, x2 имеют вопрос, а x3 имеют все ответы последовательно, я имею в виду, что x1 и x2 1-й ряд имеют вопрос, и ответ на этот вопрос - x3 1-й столбец.x1 и x2 имеют смесь числовых и текстовых данных и также имеют некоторое значение NA.

Здесь моя работа заключается в том, что я должен использовать технику НЛП для решения этой проблемы, если я наберу вопросы х1 и х2, это даст ответ х3.таким образом, вопрос дан не в полном изложении, а в некоторых выбранных словах, если я дам какое-то выбранное ключевое слово, то это будет ответ.Пожалуйста, покажите мне, где и как мне начать.Пожалуйста, руководство и sugest

1 Ответ

0 голосов
/ 22 февраля 2019

Звучит (ваш вопрос немного неясен), что у вас есть куча смешанных типов данных, и вы хотите обработать только x1 = некоторый текст1 + x2 = некоторый текст2 -> x3 = некоторый текст ответа.Я бы порекомендовал сначала очистить ваши данные, вы можете легко удалить NA или NAN, передав данные в фрейм PANDAS (я не уверен, какой язык вы используете).Если вы используете python, вы также можете легко удалить числовую информацию с помощью функции is.digit.Я не совсем уверен, что вы пытаетесь сделать, поэтому я не могу порекомендовать, что делать после очистки ваших данных.Может быть полезно опубликовать 2 примера правильных и неправильных x1, x2 и x3.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...