У меня есть текстовый файл. Мне нужно определить конкретные c заголовки абзацев, и если это правда, мне нужно извлечь соответствующие таблицы и абзацы с этим заголовком, используя python. мы можем сделать это с помощью NLP или машинного обучения? если да, пожалуйста, помогите мне собрать основы, так как я новичок в этой области. Я думал об использовании правила вроде:
if (прописная буква) и heading_length <50: return heading_text </p>
how я могу проанализировать весь документ и выбрать только имена заголовков? это все равно что автоматизировать вмешательство человека, щелкнув документ, выделив нужную тему и подняв его.
, пожалуйста, помогите мне в этом