Разбор метаданных из http прямой трансляции - PullRequest
0 голосов
/ 04 мая 2010

Я бы хотел извлечь информационную строку из интернет-радио, передаваемого по HTTP. Под информационной строкой я имею в виду короткую заметку о текущей воспроизводимой песне, названии группы и т. Д.

Желательно, чтобы я делал это на python. До сих пор я пытался открыть сокет, но оттуда я получил кучу двоичных данных, которые я не смог разобрать ...

спасибо за любые подсказки

1 Ответ

1 голос
/ 08 мая 2010

Звучит так, будто вам могут понадобиться несколько ступенек, прежде чем вы будете готовы к этому. Нет причин использовать низкоуровневую библиотеку сокетов для HTTP. Есть замечательные инструменты, как утилиты командной строки, так и модули стандартной библиотеки Python, такие как urlopen2, которые могут обрабатывать низкоуровневые спецификации TCP и HTTP для вас.

Знаете ли вы URL, по которому хранятся ваши данные? Вы пробовали что-то простое в командной строке, например, использование cURL для захвата необработанного HTML, а затем некоторые базовые инструменты, такие как grep, для поиска нужной вам информации? Я предполагаю, что метаданные на самом деле доступны в виде HTML, а не в двоичном формате, читаемом непосредственно радиостримером (возможно, во флэш-памяти?).

Трудно дать вам какие-либо подробности, поскольку ваш вопрос не содержит технических подробностей о вашем источнике данных.

...