Question

Рассмотрим следующую игрушечную строку:

меня зовут Перли, а моя фамилия Спенсер

Есть ли в Stata готовый способ (включая mata) получить количество токенов на основе указанного пользователем символа парсинга? В этом конкретном примере два токена разделены запятой.

Решения, такие как расширенная функция макроса для разбора word count используют пробел и я хотел бы избежать написания программы для этого.

Nick Cox · Answer 1 · 27 июня 2018

Количество токенов - это количество символов синтаксического анализа PLUS 1.

При использовании запятых в качестве примера разбора символов,

gen ntokens = 1 + strlen(strvar) - strlen(subinstr(strvar, ",", "", .))

См. https://www.stata -journal.com / sjpdf.html? Articlenum = dm0056 для написания этой простой уловки.

Получить количество токенов, используя определенный символ синтаксического анализа

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Получить количество токенов, используя определенный символ синтаксического анализа

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы