Regex - это не тот путь, особенно с таким большим количеством текста.
Создайте свой собственный маленький парсер:
- читать файл построчно;
- для каждой строки:
- цикл по строковому символу по символу, отслеживая любой
открывающая / закрывающая строковые литералы
- когда вы встречаете «/ *» (а вы не «внутри» строки),
сохранить этот номер смещения и цикл, пока не встретите
сначала '* /' и сохраните это число
Это даст вам все начальные и конечные числа смещений блоков комментариев. Теперь вы сможете заменить их, создав временный файл и записав текст из исходного файла во временный файл (и записав что-нибудь еще, если вы, конечно, находитесь внутри блока комментария).
Редактировать: исходные файлы 2 ГБ ??