Я пишу лексер, который должен найти границы строк.Эти строки могут быть заключены в кавычки с использованием символов Unicode (т. Е. Левых “
и правых ”
двойных кавычек), которые могут различать такие вещи, как строки в строках.
Для проверки свойств символов Unicode я используюБиблиотека ICU4C.
В настоящее время я проверяю кавычки, используя u_hasBinaryProperty(cp, UCHAR_QUOTATION_MARK)
.
. Это хорошо подходит для поиска самих кавычек, но не дает возможности отличить открытую кавычку отclose-quote.
Есть ли какое-либо значение свойства, которое я могу проверить, или другие функциональные возможности, которые я могу использовать для проверки ориентации знака кавычки без явного тестирования его для каждого возможного типа кавычек?