Я бы хотел сопоставить все предложения, которые потенциально могут быть заголовками новостей.
На данный момент у меня есть что-то вроде этого:
^([A-Z][a-z]*\b\s*)+$
Пример: Audi ожидает увеличения закупок автомобилей
^([A-Z0-9]*\b\s*)+$
Пример: AUDI ОЖИДАЕТ УВЕЛИЧЕНИЯ ПОКУПКИ АВТОМОБИЛЯ В 2 РАЗА К 2021
^([A-Za-z0-9]*\b\s*)+$
Пример 1. Audi рассчитывает увеличить закупки автомобилей в 2 раза к 2020 году
Пример 2: AUDI рассчитывает увеличить закупки автомобилей в 2 раза к 2020 году
Примечание. Все эти регулярные выражения не обнаружат следующие предложения (предложения после заголовка), когда эти предложения заканчиваются точкой.
Пример:
Увеличение закупок автомобилей в 2 раза к 2020 году
Вот еще несколько подробностей о плане аудита. Генеральный директор Audi Руперт Штадлер сказал, что ... и т.д.
У кого-нибудь есть еще какие-нибудь хорошие рекомендации по регулярным выражениям, как сопоставить возможные названия?