Какой метод проведения статистического анализа является более эффективным? - PullRequest
0 голосов
/ 18 декабря 2011

У меня есть скрипт, который анализирует файлы журнала и в конечном итоге получает определенный набор данных.

Предположим, что $ data содержит все данные, полученные из файла журнала.

Естьлучше:

  1. Держаться за $ data, открыть соединение с базой данных, добавить $ data к текущим значениям базы данных, записать (обновить) новые значения в базу данных изатем закройте соединение или

  2. Запишите каждый новый набор $ data в базу данных как новую «транзакцию» - то есть каждый раз, когда мы получаем новый набор $ data, мы будемиметь соответствующую запись (строку) в базе данных для нее и выполнить анализ в соответствии с требованиями в момент запроса?

tl; dr: немедленно обновить базу данных новыми значениями, послеанализировать и отбрасывать временные $ data или хранить все $ data в базе данных и выполнять анализ на лету по мере необходимости?

Мои мысли: вариант 1 кажется более эффективным, но что, если 2 человека загружают файлы одновременновремя?Будет ли когда-нибудь случай, когда два человека работают с базой данных и обновляют 2 разных набора данных, не привязывая их к одной транзакции за раз?Если это так, я бы хотел настроить какую-то очередь для разбора, но не уверен, как это сделать:]

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...