Не уверен, какой тип регулярного выражения вы используете, но есть: группы без захвата
Вы могли бы использовать это так:
(?:(the |a |an ))([a-zA-Z])
Захват 3-й группы, и это всегда должна быть первая буква (исключая ",,,,, ..."
Edit: хотел сказать, захватить Вторую группу для этой первой буквы. Также убедитесь, что вы запускаете это без учета регистра. И получите хороший инструмент для проверки регулярных выражений (мне нравится Expresso, но есть и другие).
Edit2: внесены некоторые уточнения;)
(?:(the|a|an) +)?([a-zA-Z0-9])