Тренировка с моделью tenorflow seq2seq - PullRequest
0 голосов
/ 27 ноября 2018

В настоящее время я работаю с lstm.У меня есть набор данных из нескольких предложений о транзакционной информации, и я хочу извлечь информацию, предположить сумму, дату и транзакцию с.Я уже пытался с базовым lstm, где моя система пыталась предсказать каждое слово данной последовательности как сумму, дату, транзакцию с или не имеет значения.

Я сделал свои тренировочные данные примерно такими:

Ввод:

Вы дали 100,00 Джону 13-08-2018

Цель: (помечено каждое слово)

сумма или транзакция с указанием даты

Вы можете видеть, что весь набор данных имеет много значений "ir" или не имеет значениятег, и я думаю, что это заставит мою систему смещать прогноз «ир» для тестовых данных.

Теперь я хочу попробовать использовать модель тензорного потока seq2seq, где входные данные - это предложение транзакции, а цель - последовательность изизвлеченная информация.Пример может быть таким:

Ввод:

Вы дали 100,00 Джону 13-08-2018.

Цель:

100.00 13-08-2018 Джон

Здесь все мои целевые значения seq будут поддерживать фиксированный формат, например, первый - это сумма, второй - дата, а третий - дата.транзакции с и т. д.

Могу ли я сделать это как модель языкового перевода с кодировщиком для входного seq и декодером для целевого seq и как я могу убедиться, что мой прогнозируемый seq для тестовых данных находится в пределах словаря данного единственноговводное предложение, а не из всего целевого словаря?

Заранее благодарим всех замечательных людей.:)

...