Мне интересно, существуют ли какие-либо библиотеки в Objective-C или доступные из них, которые позволили бы мне очищать страницы, отформатированные как эта . В частности, все даты и весь текст рядом с каждой датой. Если нет, то каков будет лучший способ сделать это? Регулярные выражения? Я слышал, что NSString
может уже иметь встроенные методы для этого. Это правда?
Я оглядывался по сторонам, чтобы посмотреть, есть ли какая-либо альтернатива очистке, такая как файл XML или API. Я нашел API, но единственные клиенты, которых я вижу, доступны на других языках, и они, похоже, просто могут публиковать контент на страницах, а не извлекать его.
РЕДАКТИРОВАТЬ : Итак, я нашел больше информации об API по этим ссылкам:
И я смог придумать этот запрос , который возвращает некоторый текст в кодировке HTML (Ну, формат XML, но он включает текст страницы, такой как »a href=
и т. Д. Я буду продолжать искать через документы, чтобы посмотреть, смогу ли я сделать это немного лучше, если нет, есть ли какие-нибудь рекомендации по его анализу?
РЕДАКТИРОВАТЬ 2 : Хорошо, благодаря этой странице документа , самый простой и понятный способ получения данных с использованием этой созданной ссылки который возвращает необработанные данные ( в вики-разметке ) соответствующего раздела. Тем не менее, я думаю, что тогда мне нужно будет разобрать это, хотя, если это действительно так, это должно быть намного проще, чем вся статья.
Есть ли у кого-нибудь рекомендации по разбору вики-разметки, такие как приведенные ниже в Objective-C?
==Events==
* [[710]] – [[Saracen]] invasion of [[Sardinia]].
*[[1275]] – Traditional founding of the city of [[Amsterdam]].
*[[1682]] – [[Philadelphia]], [[Pennsylvania]] is founded.
В конечном итоге я хочу получить NSDictionary
или подобную коллекцию, в которой будет храниться дата с сопровождающим фрагментом информации. Спасибо!