Как веб-сайты, такие как Digg, Del.icio.us и StackOverflow, реализуют теги?
Я знаю, что у этого другого вопроса есть принятый ответ отношения «многие ко многим» с таблицей перекрестных ссылок. Но как "большие мальчики" делают это? Так же? Как это масштабирование?
Вот часто цитируемая статья, которая разбивает схемы тегирования по реальным показателям производительности: http://tagging.pui.ch/post/37027746608/tagsystems-performance-tests
Автор отмечает, что основатель Delicious объясняет, что использование СУБД для тегирования просто не масштабируется до многих миллионов загружаемых элементов. Альтернатива типа Lucene может подойти лучше в таком случае.
Я уверен, что дополнительные запросы JOIN будут слишком дорогими в очень большой системе.
Теги либо хранятся ненормализовано в основной таблице, либо может быть отдельная таблица тегов, в которой есть строка для каждого тегового элемента.