Я пытаюсь передать код токенизатора.Я продолжаю читать символы, которые могут быть частью токена.Например, целое число может содержать только цифры.Поэтому в тексте ниже я продолжаю читать символы, пока не найду нецифровый символ.Таким образом, я получаю 123 в качестве токена.Затем я получаю (в качестве токена, а затем abc в качестве идентификатора. Это нормально, поскольку (является разделителем.
123(abc
Однако, в приведенном ниже тексте я получаю 123 как целое число, а затем abc как идентификатор. Нона самом деле это недопустимо, поскольку между ними нет разделителя.
123abc(
Должен ли токенизатор проверять разделители и сообщать об ошибке? Если да, то какие токены следует возвращать и откуда токенайзер должен продолжить чтение посленайден неверный токен?
Или токенизатор должен просто возвращать 123 как целое число и abc как идентификатор и позволить анализатору обнаруживать ошибки?