Я пишу программу, которая представляет собой скребок HTML, который при получении HTML-кода со страницы возвращает HTML-код, и я хочу получить слова, которые являются заглавными буквами, и затем сохранить эти слова в базе данных. Моя проблема сейчас заключается в том, что я не могу исправить алгоритм для анализа каждой строки HTML-кода, который я получил, чтобы сохранить слова. По сути, это тот формат, с которым я работаю. ВАЖНО Вы заметите, что слова, написанные заглавными буквами, всегда являются первыми, поэтому по сути мне нужно только взглянуть на первую букву каждой строки HTML, а затем решить, является ли все слово заглавной. Если это так, я хочу добавить слово в список, если это не так, я хочу перейти к следующей строке ... Так что это будет выглядеть так ...
список имен ----> Эта строка должна быть пропущена, потому что первое слово не все CAPS
Аарон ....
АВРААМ ....
Анжела ...
Эми ...
ЭШЛИ ....
AARON through ASHLEY should be added to list because first word is all CAPS
Я могу получить HTML в формате выше, но сейчас мне трудно написать алгоритм для получения первого слова каждой строки, а затем
Кто-нибудь знает, как это сделать, не используя внешний синтаксический анализ и просто используя циклы и списки. Спасибо, я ценю вашу помощь