Не анализируйте HTML с регулярным выражением! Серьезно, в общем случае это буквально невозможно. Почему вы хотите использовать регулярное выражение здесь? Было бы гораздо разумнее использовать анализатор HTML, хотя я не могу дать вам никаких конкретных предложений, потому что я не знаю, какой язык вы используете. Например, если вы используете JavaScript DOM, вам нужно что-то вроде следующего:
var scripts = document.getElementsByTagName('script')
var numScripts = scripts.length
var textScripts = []
for (var i = 0; i < numScripts; ++i)
if (scripts[i].text !== '') textScripts.push(scripts[i])
Здесь рассматривается структура HTML для определения свойств тегов сценария, а не грязный текст.
Редактировать 1: Очевидно, вы используете Java. К сожалению, я ничего не знаю о разборе HTML в Java, поэтому не могу дать вам никаких рекомендаций; однако, посмотрите на это, потому что это путь.