Требования:
У меня есть проект на Python, который анализирует потоки данных из нескольких источников в различных форматах (Atom, допустимый XML, недопустимый XML, CSV, почти мусор и т. Д.) И вставляет полученные данные в базу данных. Улов - это информация, необходимая для разбора каждого из каналов, также должна храниться в базе данных.
Текущее решение:
Мое предыдущее решение состояло в том, чтобы хранить небольшие скрипты Python, которые оцениваются на необработанных данных, и возвращать объект данных для проанализированных данных. Я бы очень хотел уйти от этого метода, поскольку он, очевидно, открывает неприятную дыру в безопасности.
Идеальное решение:
То, что я ищу, - это то, что я бы описал как синтаксический анализатор каналов для Python, управляемый шаблоном, чтобы я мог написать файл шаблона для каждого из форматов канала, и этот файл шаблона будет использоваться для понимания различных данных. форматы.
У меня был ограниченный успех в поиске чего-то подобного в прошлом, и я надеялся, что у кого-то может быть хорошее предложение.
Спасибо всем!