Как анализировать данные, используя PHP, в таблицы MySQL из файлов XML, которые имеют форматы, которые не являются универсальными и могут изменяться? - PullRequest
0 голосов
/ 31 января 2019

Проблема:

Я собираюсь создать в PHP веб-инструмент для помощи пользователям в доступе к информации, разбросанной по коллекции файлов XML, из которой я планирую хранить данные в таблицах в MySQL.Многие примеры, которые я вижу в Интернете, похоже, основаны на импорте данных из группы файлов XML, которые используют одинаковое форматирование.У меня нет такой роскоши.

Как я смогу анализировать файлы XML, которые имеют следующие факторы?

  • В этой коллекции несколько категорий файлов XML, каждый из которых имеет отдельные форматы и типы информации.которые дифференцируют каждую категорию.В идеале я бы создал отдельную таблицу для каждой категории.Однако ...
  • В эту коллекцию могут быть добавлены дополнительные новые категории файлов XML без моего ведома заранее.
  • Любая существующая категория может иметь реструктурированный формат и / или типы информациивнутри может быть увеличено или уменьшено, также без моего ведома заранее.
  • Даже среди одной и той же категории файлов XML могут быть более старые файлы с устаревшей версией форматирования.

Ожидаемые результаты:

Используя пример, где коллекция XML касается группы людей, если вы ищете "карие глаза", вы получите страницы результатов поиска для всех, у кого карие глаза.Одна из страниц - «Роберт».Если щелкнуть этот результат, вы перейдете на страницу, где отображается вся информация из XML-файла Роберта (удобочитаемое форматирование, которое будет обработано позже).

1 Ответ

0 голосов
/ 31 января 2019

вы можете создать только самообучающийся парсер, который добавляет новые столбцы в таблицу всякий раз, когда находит новые свойства в XML.в основном, доступны две опции: либо создать модель данных, которая в какой-то момент времени сопоставляет все записи, либо заполнить беспорядок в базе данных noSQL, что не обязательно улучшит ситуацию.«один размер подходит всем» (вставка неструктурированных данных в структурированную базу данных) не вариант.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...