Неструктурированные данные, подходы и решения - PullRequest
1 голос
/ 16 мая 2019

У меня много неструктурированных / полуструктурированных данных, например, электронных писем с базовыми / из / субъектами, но много основного текста, содержащего все виды других видов данных.Я надеюсь использовать это для информирования некоторых автоматических, аналитических или даже тепловых карт, если географические данные содержатся.

Хотя я пытаюсь подходить к проблеме правильно.От системной архитектуры у кого-нибудь есть «порядок операций» к проектированию систем и процессов вокруг этого?

Лучшее, что я могу сделать гостем: Шаг 1 - определить «корзину» для размещения данных. Шаг 2 - применитьв качестве примера, может быть график или общая структура данных to / from / subject.Шаг 3 может заключаться в применении НЛП или, возможно, Уотсона для добычи неструктурированных данных по определенным ключевым словам или настроениям.Вариант использования вокруг того, что важно найти, будет управлять всем этим.Шаг 4 может заключаться в том, чтобы применить эту «найденную» структуру и функции сборки, автоматизацию, процесс оттуда.

Имеет ли это какой-то смысл?Надеюсь, я на правильном пути, но хотел бы услышать мысли.

...