Оптимизация регулярных выражений - PullRequest
1 голос
/ 01 июня 2011

У меня есть одно регулярное выражение, которое конвертирует HTML в TXT. Но это занимает много использования процессора. Как я могу оптимизировать это?

((\n|\r){2,}) | (\r|\n)|<head.*?</head>|<script.*?</script> |<meta[^>]+>|<style.*?</style> | <[^>]*> |&[^\s]*;

1 Ответ

1 голос
/ 09 июня 2011

Используйте HTML-парсер, если можете. Regex плохо работает с HTML по разным причинам, и производительность неизбежно также пострадает.

...