Вся концепция «количества символов» на самом деле не применима к Юникоду, поскольку коды не отображают 1: 1 на глифы. Метод, предложенный @borrible, подойдет, если вы хотите установить требования к хранилищу в несжатом виде, но это все, что он может вам сказать.
Например, есть такие кодовые точки, как «пробел нулевой ширины», которые не занимают места на экране при визуализации, но занимают кодовую точку или модификаторы для диакритических знаков или гласных. Поэтому любая статистика должна быть конкретной для конкретного приложения.
Правильный рендерер Unicode будет иметь функцию, которая может сказать вам, сколько пикселей будет использовано для рендеринга строки, если эта информация - то, что вам нужно.