Question

ОК, у меня длинный список (около 43 800 строк) записей, и я хочу выбрать подмножество этого списка. Список находится в базе данных, и программа, которая читает базу данных, может использовать одно или несколько регулярных выражений.

Лучше ли использовать несколько (возможно, до 100 или около того) регулярных выражений в одном обращении к программе базы данных, чтобы по существу выбрать записи, которые я хочу

OR

было бы лучше использовать гораздо меньшее количество регулярных выражений (до 10), чтобы выбрать гораздо больше записей в массиве, а затем использовать цикл for и некоторые простые операторы if для фильтрации данных. Я не являюсь интересует?

Я читал или слышал, что лучше избегать чрезмерного использования регулярных выражений, поскольку они вычислительно дороги?

dma · Answer 1 · 10 марта 2009

Ответ KevDog кажется верным шагом вперед.

Я просто хотел добавить, что вы можете попробовать оба варианта и измерить разницу в производительности. Таким образом, вы устраните все догадки и, естественно, примете во внимание все ваши особые случаи, о которых мы не можем знать.

KevDog · Answer 2 · 10 марта 2009

Я бы порекомендовал второй подход, особенно если вы можете найти способ разделить поиски регулярных выражений в разные потоки и получить возможность параллелизма. Разделяй и властвуй, детка!

Длинный список, несколько регулярных выражений и производительность

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Длинный список, несколько регулярных выражений и производительность

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов