Вам придется нормализовать вашу базу данных.
Первая таблица для хранения страниц
table pages (
id unsigned integer auto_increment primary key,
page blob,
other_interesting_data_about_a_page )
Затем таблица для слов содержит
table wc (
id unsigned integer auto_increment primary key
word varchar(20) unique key,
count unsigned integer default 1,
other_interesting_data_about_a_word.... )
Затем таблица для связывания слов со страницами
table word_page (
word_id unsigned integer,
page_id unsiged integer,
pos_in_page unsigned integer, /*position*/
primary key pk (word_id, page_id, pos_in_page) )
Теперь вы можете запросить количество слов на странице:
SELECT COUNT(*)
FROM word_page
WHERE page_id = 123
Или сколько раз слово «the» повторяется на странице.
SELECT COUNT(*)
FROM word_page wp
INNER JOIN wc ON (wp.word_id = wc.id)
WHERE wp.page_id = 123 AND wc.word = 'the'
Слово предупреждения
И поле PAGES должно быть списком всех страниц, разделенных запятыми .....
Никогда не используйте CSV в базе данных, это худший антишаблон, который вы можете использовать, и он будет кусать вас снова и снова, если вы влюбитесь в него.
Если вы когда-нибудь почувствуете необходимость, ударьте себя по голове, пока желание не пройдет, вместо этого используйте отдельный стол или два.