Я понимаю, что вы хотите собрать данные с веб-страницы Gmail.
Глядя на html для почтового ящика Gmail, кажется, что они запускают большинство переменных через минимизатор, что заставило бы меня с осторожностью относиться к идентификаторам или именам классов. Может быть, они сделают небольшие изменения завтра, и минимизатор выберет новые имена для всего.
С другой стороны, некоторые атрибуты кажутся стабильными. Например: роль = «презентация» в
<table class="Bs nH iY" cellpadding="0" role="presentation">
или по электронной почте = здесь
<span class="vN Y7BVp" email="info@avatron.com">
... которая содержит информацию, которую вы действительно хотите:
<div class="vT">Avatron Software (info@avatron.com)</div>
Так что я хотел бы подойти к этому:
- используя .getElementsByTagname ('table'), а затем перебирая, пока не найду того, чья роль = "presentation"
- используя [thePresentationTable] .getElementsByTagname ('span'), а затем перебирая, пока не найду того, у кого есть атрибут 'email ='
- используя дерево для поиска текстового узла Полное имя, например: [theEmailSpan] .firstChild или [theEmailSpan] .firstChild.firstSibling или что у вас есть