Проверка, открывается ли или закрывается ли кавычка Юникода - PullRequest
0 голосов
/ 19 сентября 2019

Я пишу лексер, который должен найти границы строк.Эти строки могут быть заключены в кавычки с использованием символов Unicode (т. Е. Левых и правых двойных кавычек), которые могут различать такие вещи, как строки в строках.

Для проверки свойств символов Unicode я используюБиблиотека ICU4C.

В настоящее время я проверяю кавычки, используя u_hasBinaryProperty(cp, UCHAR_QUOTATION_MARK).

. Это хорошо подходит для поиска самих кавычек, но не дает возможности отличить открытую кавычку отclose-quote.

Есть ли какое-либо значение свойства, которое я могу проверить, или другие функциональные возможности, которые я могу использовать для проверки ориентации знака кавычки без явного тестирования его для каждого возможного типа кавычек?

1 Ответ

2 голосов
/ 19 сентября 2019

Открытие или закрытие кавычки зависит от языка / локали и, следовательно, выходит за рамки Юникода.Юникод работает только со скриптами.Примеры:

  • «Швейцарский»
  • »Польский«
  • »Финский»

Посмотреть в другом месте.

...