Библиотека хорошего текстового токенизатора - PullRequest
1 голос
/ 11 октября 2009

Что такое хорошая библиотека с открытым исходным кодом C tokenizer?

Я ищу что-то вроде

Tokenize("there are three apples. One is orange, the other is blue,"
         " and, finally, the last is yellow!")

с выводом, не содержащим знаков препинания.

Ответы [ 3 ]

1 голос
/ 11 октября 2009

Если единственной необходимостью является удаление знаков препинания, я бы использовал цикл for, который выводит (что бы это ни значило в вашем контексте) символьную строку источника, пропуская ispunct() единицы.

0 голосов
/ 11 октября 2009

lex / flex - классический инструмент, но он может быть несколько тяжелым для того, что вы делаете.

0 голосов
/ 11 октября 2009

Я бы порекомендовал strtok , который доступен в string.h.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...