В настоящее время я работаю с lstm.У меня есть набор данных из нескольких предложений о транзакционной информации, и я хочу извлечь информацию, предположить сумму, дату и транзакцию с.Я уже пытался с базовым lstm, где моя система пыталась предсказать каждое слово данной последовательности как сумму, дату, транзакцию с или не имеет значения.
Я сделал свои тренировочные данные примерно такими:
Ввод:
Вы дали 100,00 Джону 13-08-2018
Цель: (помечено каждое слово)
сумма или транзакция с указанием даты
Вы можете видеть, что весь набор данных имеет много значений "ir" или не имеет значениятег, и я думаю, что это заставит мою систему смещать прогноз «ир» для тестовых данных.
Теперь я хочу попробовать использовать модель тензорного потока seq2seq, где входные данные - это предложение транзакции, а цель - последовательность изизвлеченная информация.Пример может быть таким:
Ввод:
Вы дали 100,00 Джону 13-08-2018.
Цель:
100.00 13-08-2018 Джон
Здесь все мои целевые значения seq будут поддерживать фиксированный формат, например, первый - это сумма, второй - дата, а третий - дата.транзакции с и т. д.
Могу ли я сделать это как модель языкового перевода с кодировщиком для входного seq и декодером для целевого seq и как я могу убедиться, что мой прогнозируемый seq для тестовых данных находится в пределах словаря данного единственноговводное предложение, а не из всего целевого словаря?
Заранее благодарим всех замечательных людей.:)