Свернуть HTML-контент за сайтом с помощью логина (отслеживание статуса рукописи) - PullRequest
0 голосов
/ 18 мая 2018

Я бы хотел отследить статус рукописи для бумаги, представленной Nature Materials.

Это целевая страница: http://mts -nm.nature.com / cgi-bin / main.plex

Я первый автор, поэтому у меня есть логин и пароль.

Когда я вхожу, меня перенаправляют на страницу статуса отслеживания:

http://mts -nm.nature.com / cgi-bin / main.plex? Form_type = status_details & j_id =8 & ms_id = 32234 & ms_rev_no = 0 & ms_id_key = SFfgnknwkgnregKsdnflsfgqn

Я хочу проанализировать следующую таблицу:

</TABLE>
<BR>&nbsp;<BR>
         <TABLE BORDER=5>
         <TR>
            <TH>Stage</TH>
            <TH>Start Date</TH>
</TR>
<TR><TD>Manuscript received</TD><TD>16th May 18</TD></TR>
<TR><TD>Manuscript submitted</TD><TD>15th May 18</TD></TR>
</TABLE>

Вот как я пытаюсь извлечь соответствующие части таблицы с помощью curl:

curl --user username:password --cookie-jar ./my_cookie 'http://mts-nm.nature.com/cgi-bin/main.plex'
curl --cookie mycookie 'http://mts-nm.nature.com/cgi-bin/main.plex?form_type=status_details&j_id=8&ms_id=32234&ms_rev_no=0&ms_id_key=SFfgnknwkgnregKsdnflsfgqn' > parsed.html
grep 'May 18' parsed.html

Поскольку он не скручивает страницу с информацией о состоянии, он ничего не возвращает.Что я делаю неправильно?

Спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...