Поиск конкретных классов в столбцах таблицы (python, lxml) - PullRequest
0 голосов
/ 25 октября 2018

Я был брошен ("изменить эту существующую программу") в python и lxml и попытался найти способ сделать это.Поэтому прошу прощения за вопрос, может быть, простой или глупый вопрос ... но я немного застрял.

Программа разбивает таблицу на строки с помощью

rows=page.cssselect("table-data.table-top tbody tr")

Различные столбцыадресованы (после: для строки в строках)

dns = row.cssselect(".column-number")
cds = row.cssselect(".column-documents")

Однако в столбце "column-documents" есть несколько (может быть 0, может быть 5) записей (пусто, 1 значок со ссылкой, до 5 иконоксо ссылками и различными значениями, каждое из которых определено своим собственным классом).И мне нужно выяснить, есть ли там конкретная запись (иконка со ссылкой).

Он описан как особый класс "class="document-link submission-link hide-text".

<tr class="row-0 tier1-5">
   <td class="column-notext">4.</td>
   <td class="column-label">Descriptive title</td>
   <td class="column-number">007</td>
   <td class="column-dokumente">
      <a href="/somelink.pdf" target="_blank" title="title of pdf">
         <span class="document-link submission-link hide-text">
            <span>Main Document</span>
         </span>
      </a>
      <a href="/somelink.pdf) title 2">
         <span class="attachment-link submission-attachment-link hide-text">
            <span>(text)</span>
         </span>
      </a>
      <a href="/link.pdf" target="_blank" title="some title">
         <span class="document-link beschluss-link hide-text">
            <span>text</span>
         </span>
      </a>
      <span class="document-spacer hide-text" />
      <a href="html-link" title="some title">
         <span class="vorgang-link hide-text">
            <span>text</span>
         </span>
      </a>
   </td>
</tr>

Мне просто нужно знать, есть это или нет.И мой глупый вопрос: как мне это сделать?

Заранее спасибо, Андреас.

...