Я бы хотел отследить статус рукописи для бумаги, представленной Nature Materials.
Это целевая страница: http://mts -nm.nature.com / cgi-bin / main.plex
Я первый автор, поэтому у меня есть логин и пароль.
Когда я вхожу, меня перенаправляют на страницу статуса отслеживания:
http://mts -nm.nature.com / cgi-bin / main.plex? Form_type = status_details & j_id =8 & ms_id = 32234 & ms_rev_no = 0 & ms_id_key = SFfgnknwkgnregKsdnflsfgqn
Я хочу проанализировать следующую таблицу:
</TABLE> <BR> <BR> <TABLE BORDER=5> <TR> <TH>Stage</TH> <TH>Start Date</TH> </TR> <TR><TD>Manuscript received</TD><TD>16th May 18</TD></TR> <TR><TD>Manuscript submitted</TD><TD>15th May 18</TD></TR> </TABLE>
Вот как я пытаюсь извлечь соответствующие части таблицы с помощью curl:
curl --user username:password --cookie-jar ./my_cookie 'http://mts-nm.nature.com/cgi-bin/main.plex' curl --cookie mycookie 'http://mts-nm.nature.com/cgi-bin/main.plex?form_type=status_details&j_id=8&ms_id=32234&ms_rev_no=0&ms_id_key=SFfgnknwkgnregKsdnflsfgqn' > parsed.html grep 'May 18' parsed.html
Поскольку он не скручивает страницу с информацией о состоянии, он ничего не возвращает.Что я делаю неправильно?
Спасибо