Как долго хранится архив журналов трафика веб-сервера? - PullRequest
6 голосов
/ 16 октября 2008

В настоящее время у нас в ферме четыре веб-сервера, генерирующих веб-журналы IIS по 100 МБ в день. Они могут быть сжаты довольно эффективно до примерно 5% от их размера.

Мы планируем использовать waRmZip для перемещения их с серверов на SAN. Примерно через неделю мы можем быть уверены, что у нас нет технических проблем для расследования, поэтому единственное, что им нужно, это использовать их для анализа тенденций в качестве дополнения к Google Analytics.

Какие сроки хранения рекомендуют люди? Существуют ли какие-либо правовые требования для хранения этих данных?

Ответы [ 3 ]

1 голос
/ 16 октября 2008

Пожалуйста, учитывайте также и конфиденциальность данных вашего веб-журнала. Я понятия не имею, будет ли доступ к вашим веб-приложениям считаться конфиденциальным, если он станет общедоступным, но вы должны понимать, что ваши веб-журналы содержат необходимую информацию для потенциальной идентификации людей (особенно в сочетании с другой информацией, доступной в других местах). Ваша политика конфиденциальности должна отражать, как долго вы сохраняете эти журналы и для каких целей они будут использоваться. Google, я думаю, недавно решил анонимизировать свои журналы через 9 месяцев, чтобы защитить конфиденциальность пользователей. Конечно, их ситуация немного отличается, так как они собирают так много информации, но вы должны учитывать потребности своих клиентов, а также свои собственные при определении того, как долго и в какой форме хранить ваши журналы.

1 голос
/ 16 октября 2008

Юридические требования будут зависеть от вашей страны, от того, сколько вы регистрируете, и, возможно, от характера вашего бизнеса. Поговорите с юристами вашей компании - юридические консультации по SO, вероятно, будут стоить того, за что вы заплатите.

Если вы храните только 5 МБ в день, вы сможете хранить их в основном столько времени, сколько хотите, не беспокоясь о техническом фронте.

0 голосов
/ 16 октября 2008

Я, как правило, навсегда останусь моим. Это в основном для анализа тенденций, потому что Google скучает по некоторым посетителям (не JavaScript).

...