Нужно ли вам хранить источник в базе данных?
Попытка выполнить 'LIKE' запросы к данным в любом случае будет отстойной.
Хранить необработанные данные в файловой системе в виде стандартных файлов. Просто не кладите их все в одну папку. используйте хеши идентификатора, чтобы хранить их в предсказуемых папках.
(хотя, конечно, совершенно возможно хранить текст в базе данных, он увеличивает размер вашей базы данных и усложняет работу с ней. Резервные копии (намного!) Больше, изменяя механизм хранения, становясь более болезненным и т. д. Масштабирование вашей файловой системы, как правило, это просто добавление еще одного жесткого диска. Это не так легко работает с базой данных - вы начинаете нуждаться в шарде)
... чтобы выполнить какой-либо поиск данных, вы пытаетесь построить индекс. У меня есть только опыт работы со SphinxSearch, но это позволяет вам указать имя файла во входной базе данных.