Получить количество токенов, используя определенный символ синтаксического анализа - PullRequest
0 голосов
/ 27 июня 2018

Рассмотрим следующую игрушечную строку:

меня зовут Перли, а моя фамилия Спенсер

Есть ли в Stata готовый способ (включая mata) получить количество токенов на основе указанного пользователем символа парсинга? В этом конкретном примере два токена разделены запятой.

Решения, такие как расширенная функция макроса для разбора word count используют пробел и я хотел бы избежать написания программы для этого.

1 Ответ

0 голосов
/ 27 июня 2018

Количество токенов - это количество символов синтаксического анализа PLUS 1.

При использовании запятых в качестве примера разбора символов,

gen ntokens = 1 + strlen(strvar) - strlen(subinstr(strvar, ",", "", .))  

См. https://www.stata -journal.com / sjpdf.html? Articlenum = dm0056 для написания этой простой уловки.

...