Как определить, какой блог API - PullRequest
2 голосов
/ 25 августа 2008

Допустим, вы хотите создать просто мертвый простой BlogEditor, и одна из ваших идей - делать то, что делает Live Writer, и запрашивать только URL-адрес людей из блога. Как определить тип блога?

Базовое обнаружение можно выполнить с помощью самого URL-адреса, например «http://myblog.blogger.com”» и т. Д. Но что, если он размещен самостоятельно?

Меня больше всего интересует, как это сделать на Java, но этот вопрос можно также использовать в качестве справочного материала для любого другого языка.

Ответы [ 3 ]

3 голосов
/ 25 августа 2008

Многие (большинство?) Блогов будут иметь метатег для «генератора», который будет перечислять блог-движок. Например, блог блоггера будет содержать следующий метатег:

<meta name="generator" content="Blogger" />  

Мой блог подтекста показывает следующий метатег генератора:

<meta name="Generator" content="Subtext Version 1.9.5.177" />  

Этот метатег будет первым местом для поиска. Для блогов, которые не устанавливают этот метатег в источнике, вам придется искать шаблоны для определения типа блога.

1 голос
/ 25 августа 2008

Чтобы определить другие шаблоны для поиска в движке блогов (для тех, у кого нет метатега генератора), вам нужно просто просмотреть источник, чтобы определить что-то специфическое для этого типа блога. Вам также нужно сравнить это по нескольким блогам этого типа, так как вы хотите убедиться, что это не что-то специфическое для скина или темы, используемой только в блоге.

Еще одной идеей было бы прочитать документы различных распространенных блоговых движков, чтобы узнать, как определить местоположение путей к таким вещам, как MetaWebLog API и т. Д. IIRC, Live Writer имеет встроенную поддержку наиболее распространенных типов остальные относятся к категории «Блог API MetaWebLog» или что-то в этом роде.

1 голос
/ 25 августа 2008

В некоторых блогах есть метатег Generator, например Wordpress - вы можете узнать, есть ли исключения из этого.

Вы должны быть осторожны, как вы обнаруживаете это, Google удивил меня этой строкой:

<meta content='blogger' name='generator'/>

Одиночные кавычки являются богохульством.

...