Как я могу извлечь текст в разные разделы? - PullRequest
0 голосов
/ 19 июня 2019

Скажем, у меня есть фрагмент текста типа

The robot says: {
   "temperature": 32,
   "timestamp": "2019-06-19T00:00:00",
   "command": "gcc -o test test.c",
   "comment": "gcc vs llvm"
}

Как написать программу для распознавания сущностей?как

  • объект json после The robot says:
  • в объекте json, есть число 32 и строка даты и времени 2019-06-19T00:00:00, где 2019-06-19 - дата, 00:00:00 - это время.
  • в объекте json, gcc -o test test.c - командная строка для компиляции test.c, поэтому gcc - это команда, а test.c - это файл;Между тем, gcc vs llvm показывает, что gcc - это слово, и оно описывает имя продукта / компилятора.

Регулярное выражение не может завершить работу, так как нам нужно извлечь данные, включая информацию о структуре / иерархии.

Модель машинного обучения может указывать классификацию (скользящее окно + метод привязки может определять разные категории) и существует ли существующая модель?

...