Длинный список, несколько регулярных выражений и производительность - PullRequest
0 голосов
/ 10 марта 2009

ОК, у меня длинный список (около 43 800 строк) записей, и я хочу выбрать подмножество этого списка. Список находится в базе данных, и программа, которая читает базу данных, может использовать одно или несколько регулярных выражений.

Лучше ли использовать несколько (возможно, до 100 или около того) регулярных выражений в одном обращении к программе базы данных, чтобы по существу выбрать записи, которые я хочу

OR

было бы лучше использовать гораздо меньшее количество регулярных выражений (до 10), чтобы выбрать гораздо больше записей в массиве, а затем использовать цикл for и некоторые простые операторы if для фильтрации данных. Я не являюсь интересует?

Я читал или слышал, что лучше избегать чрезмерного использования регулярных выражений, поскольку они вычислительно дороги?

Ответы [ 2 ]

2 голосов
/ 10 марта 2009

Ответ KevDog кажется верным шагом вперед.

Я просто хотел добавить, что вы можете попробовать оба варианта и измерить разницу в производительности. Таким образом, вы устраните все догадки и, естественно, примете во внимание все ваши особые случаи, о которых мы не можем знать.

2 голосов
/ 10 марта 2009

Я бы порекомендовал второй подход, особенно если вы можете найти способ разделить поиски регулярных выражений в разные потоки и получить возможность параллелизма. Разделяй и властвуй, детка!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...