Если символы будут когда-либо только ASCII, вы можете ссылаться на них как ASCII. В противном случае вам следует использовать термин Unicode, который, как вы заявляете, является надлежащим расширенным набором ASCII. Имейте в виду, что даже если вы относите к ним как ASCII, возможно, потребуется изменить кодировку , если вы отправляете их в нечто, что ожидает настоящий (на основе октетов) ASCII .
Если ваше программное обеспечение обрабатывает только кодовые точки в диапазоне ASCII (и смотрите ниже, это, как правило, не очень хорошая идея), гораздо проще сказать (пользователям или в документации) «значения ASCII», чем « Значения Unicode в диапазоне ASCII ": -)
На самом деле вводит в заблуждение , чтобы ссылаться на ваши значения как на кодовые точки Unicode в контексте работы с заглавными буквами, если вы обрабатываете только заглавные буквы в диапазоне ASCII.
Любое новое программное обеспечение в настоящее время должно быть написано с учетом Unicode, и что включает тот факт, что заглавные буквы не ограничены диапазоном ASCII.
Например, часть греческих символов нигде нет рядом с диапазоном ASCII, который имеет свойства верхнего и нижнего регистра. Файл SpecialCasing.txt
показывает эти свойства, а также есть FAQ по теме.