(Regex) как получить содержимое определенного div (p, span и т. Д.), Игнорируя содержащийся в нем HTML, используя Python - PullRequest
0 голосов
/ 21 мая 2018

введите описание изображения здесь

Привет семейство stackoverflow

Элементы для выбора элемента, который я хочу восстановить.цель здесь состоит в том, чтобы восстановить все содержимое маяка quelquonque, не зная об этом коде HTML, который содержит

My regex is  ((<p)([\s]+|([a-zA-Z=(\"|')_[\s]+|]+)([\s]+|)>)|<p>)([a-zA-Z ]+)<

<ol class="arabic">
  <li>
    <div class="first">
      Start the notebook server from the
      <a class="reference internal" href="glossary">
        <span class="xref std std-term">command line</span>
      </a>
      : yes very good
    </div>

    <div class="highlight-default notranslate">
      The notebook open in your browse.
      <span>ok very good</span>
      <span class="n">ok nice</span>
      <span class="n">notebook</span>
    </div>
  </li>
</ol>
...