Скажем, у меня есть фрагмент текста типа
The robot says: {
"temperature": 32,
"timestamp": "2019-06-19T00:00:00",
"command": "gcc -o test test.c",
"comment": "gcc vs llvm"
}
Как написать программу для распознавания сущностей?как
- объект json после
The robot says:
- в объекте json, есть число
32
и строка даты и времени 2019-06-19T00:00:00
, где 2019-06-19
- дата, 00:00:00
- это время. - в объекте json,
gcc -o test test.c
- командная строка для компиляции test.c
, поэтому gcc
- это команда, а test.c
- это файл;Между тем, gcc vs llvm
показывает, что gcc
- это слово, и оно описывает имя продукта / компилятора.
Регулярное выражение не может завершить работу, так как нам нужно извлечь данные, включая информацию о структуре / иерархии.
Модель машинного обучения может указывать классификацию (скользящее окно + метод привязки может определять разные категории) и существует ли существующая модель?