Я работаю над системой кэширования на основе файловой системы Linux для веб-приложения, которое будет использоваться в качестве крайней меры, когда APC и Memcache недоступны.Система будет кэшировать от 500 000 до 1 000 000 уникальных идентификаторов строк, каждый из которых имеет большое значение.Я беру MD5-хэш идентификатора строки и, основываясь на первых нескольких символах, создаю подпапки, чтобы не слишком много файлов попадало в один каталог.
Я знаю, что эта концепция работает, потому что я ее используюв аналогичном приложении.
Хотя существует до 1 ММ строковых идентификаторов, все они указывают одно из 18 000 уникальных значений, поэтому, например, может быть 100 000 строковых идентификаторов, которые все указывают на одно и то же значение.Сейчас это означает, что есть 100 000 файлов с разными именами файлов, содержащих одно и то же содержимое, что плохо для основного кэша файловой системы.
Есть ли какой-либо недостаток в кэшировании 18 000 уникальных значений, а затем для каждого уникального идентификатора строки, создавсимволическая ссылка на файл уникальных значений?Таким образом, буфер файловой системы может кэшировать 18 000 файлов и дескрипторов для символических ссылок.
Я просто обеспокоен наличием 1 000 000 символических ссылок и любыми потенциальными проблемами, которые это может создать.
Заранее спасибо!