Как повторно найти источник HTML с регулярным выражением в Python - PullRequest
0 голосов
/ 22 декабря 2010

Я разрываю голову, но не могу разобраться с этим.

номера, имена вымышленные. но идея такова

Я прочитал ссылку типа 'https://graph.facebook.com/123'

это приводит к исходному коду:

{
   "id": "123",
   "name": "John Doe",
   "first_name": "John",
   "last_name": "Doe",
   "link": "http://www.facebook.com/people/John-Doe/123",
   "gender": "male",
   "locale": "en_US"
}

Я хочу извлечь всю информацию об идентификаторе, имени и т. Д.

Я пытаюсь это сделать, но не получается

    link = 'https://graph.facebook.com/123'
    result = browser.open(link)
    text = result.read()
    result.close()
    id = re.search('"id": "(.*?)",', cont)

regex '"id": "(. *?)",' Вроде бы правильно, но ничего не возвращается .. Почему ???

1 Ответ

7 голосов
/ 22 декабря 2010

Кажется, JSON, вы не хотите использовать регулярные выражения для его анализа.

link = 'https://graph.facebook.com/123'
result = browser.open(link)
data = json.load(result)
print data['id']
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...