Пропуск данных по URL - PullRequest
       0

Пропуск данных по URL

0 голосов
/ 23 февраля 2020

Я хочу напечатать имя автора. Вот код:

import urllib.request
import re
import urllib.parse

html = 'https://www.newgrounds.com/audio/listen/911841'
values = {'s': 'basics',
          'submit': 'search'}
data = urllib.parse.urlencode(values)
data = data.encode('utf-8')
req = urllib.request.Request(html, data)
resp = urllib.request.urlopen(req)
respData = resp.read()


text = re.findall('<a href="//(.*?).newgrounds.com">(.*?)</a>', str(respData))

for eachA in text:
    print(eachA)

Вот результат:

('www', 'Newgrounds')
('www.newgrounds.com/passport" id="passport_login" rel="nofollow">Login</a>\\n\\t\\t\\t\\t\\t/\\n\\t\\t\\t\\t\\t<a href="//www.newgrounds.com/passport/signup/new" id="passport_create" rel="nofollow">Sign Up</a>\\n\\t\\t\\t\\t</div>\\n\\t\\t\\t\\t\\t</div>\\n\\t</div>\\n</div>\\n\\t<script src="//js.ngfiles.com/global/passport.js"></script>\\n\\t<div class="outer" id="outer-skin">\\n\\n\\t\\t<div class="header-nav-row" id="header-nav-row">\\n\\t\\t\\t<div class="header-nav-container header-nav-relative" id="header-nav-container">\\n\\t\\t\\t\\t<nav id="topnav" class="header-nav-buttons">\\n\\t\\t\\t\\t\\t<a href="//www.newgrounds.com/movies" class="header-nav-button-movies">Movies</a><a href="//www.newgrounds.com/games" class="header-nav-button-games">Games</a><a href="//www.newgrounds.com/audio" class="header-nav-button-audio">Audio</a><a href="//www.newgrounds.com/art" class="header-nav-button-\\/p>\\\\r\\\\n\\\\t<\\\\/div>\\\\r\\\\n\\\\r\\\\n\\\\t<div class=\\\\"audio-listen-controls\\\\">\\\\r\\\\n\\\\t\\\\t<div class=\\\\"play-controls\\\\">\\\\r\\\\n\\\\t\\\\t\\\\t<button class=\\\\"audio-listen-btn\\\\" id=\\\\"audio-listen-play\\\\" /489/489978_large.png?f1524339727" alt="Waterflame"></div>\\n\\t')
('waterflame', 'Waterflame')

Как вы можете видеть, он выводит кучу мусора. Мне нужна только 3-я строка. Я обнаружил, что проблема с первым (. *?) В «тексте». Как я могу сохранить его как переменную, но как заставить его ничего не возвращать и просто пропустить? Я довольно новичок в программировании в целом, поэтому извините, если я не очень хорошо объяснил свою проблему.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...