Извлечение раздела из 10K - PullRequest
0 голосов
/ 02 мая 2019

Я пытаюсь извлечь выбранные разделы из 10 КБ (HTML) для дальнейшего анализа. В частности, пункт 6 - «Отдельные финансовые данные»

Намерение - извлечь весь текст между Пункт 6 - «Отдельные финансовые данные» а также Пункт 7 - «Обсуждение руководством и анализ финансового состояния и результатов деятельности»

Использование регулярного выражения не дает нужного мне результата, так как есть упоминания о пункте 6 ----- и в других разделах.

Beuatifulsoup, кажется, путь, но не в состоянии получить требуемый результат в настоящее время

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...