Мы отслеживаем строки пользовательских агентов на нашем сайте. Я хочу сделать некоторую статистику по ним, чтобы увидеть, сколько у нас пользователей IE6 (поэтому мы знаем, против чего нам нужно развиваться), а также сколько у нас мобильных пользователей.
Итак, у нас есть такие записи:
Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; FunWebProducts)
Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; FunWebProducts; .NET CLR 1.0.3705; .NET CLR 1.1.4322; Media Center PC 4.0; .NET CLR 2.0.50727)
И в идеале было бы неплохо увидеть все «значимые» строки, которые просто означали бы, вероятно, строки длиннее определенной длины. Например, я хотел бы видеть, сколько записей содержит FunWebProducts
, или .NET CLR
, или .NET CLR 1.0.3705
- но я не хочу видеть, сколько из них имеет точку с запятой , Поэтому я не обязательно ищу уникальные строки, но все строки, даже подмножества. Итак, я хотел бы увидеть количество всех Mozilla
, зная, что это включает в себя значения для Mozilla/5.0
и Mozilla/4.0
. Было бы неплохо, если бы для этого был вложенный дисплей, начиная с самых коротких строк и двигаясь вниз. Что-то вроде
4,2093 Mozilla
1,093 Mozilla/5.0
468 Mozilla/5.0 (Windows;
47 Mozilla/5.0 (Windows; U
2,398 Mozilla/4.0
Это звучит как домашнее задание по информатике. Как бы это называется? Существует ли что-то подобное или я пишу свое?