Масштабирование веб-приложений и тегов - Digg, Del.icio.us, StackOverflow - PullRequest
4 голосов
/ 15 февраля 2009

Как веб-сайты, такие как Digg, Del.icio.us и StackOverflow, реализуют теги?

Я знаю, что у этого другого вопроса есть принятый ответ отношения «многие ко многим» с таблицей перекрестных ссылок. Но как "большие мальчики" делают это? Так же? Как это масштабирование?

Ответы [ 2 ]

12 голосов
/ 15 февраля 2009

Вот часто цитируемая статья, которая разбивает схемы тегирования по реальным показателям производительности: http://tagging.pui.ch/post/37027746608/tagsystems-performance-tests

Автор отмечает, что основатель Delicious объясняет, что использование СУБД для тегирования просто не масштабируется до многих миллионов загружаемых элементов. Альтернатива типа Lucene может подойти лучше в таком случае.

0 голосов
/ 10 марта 2009

Я уверен, что дополнительные запросы JOIN будут слишком дорогими в очень большой системе.

Теги либо хранятся ненормализовано в основной таблице, либо может быть отдельная таблица тегов, в которой есть строка для каждого тегового элемента.

...