Что-то вроде этого:
(0..0x02FFFF).each do |codepoint|
begin
character = codepoint.chr(Encoding::UTF_8)
# .... Test your regexp here
rescue RangeError
# Ignore gaps in codepoint
end
end
Как сказал @Stefan в своем комментарии: Вы будете тестировать довольно большое количество символов с этим ....
Исправлена ошибка, спасибо Стефану
ИСПРАВЛЕНО: Работа с пробелами в диапазоне кодовых точек Unicode.Обратите внимание, что в моем решении я опустил плоскости Unicode 3-16.