У меня есть несколько календарей Google, которые я хотел бы объединить и разместить на рабочем столе Windows с помощью Samurize . Я пытался использовать плагин Page Scraper от Samurize, но, похоже, он не подходит для этой задачи.
Я могу заставить Samurize запустить скрипт и разместить его на рабочем столе, но я не уверен
какие лучшие инструменты для этого.
Все мои URL имеют вид:
http://www.google.com/calendar/feeds/example%40gmail.com/private-REMOVED/basic?futureevents=true&orderby=starttime&sortorder=ascending&singleevents=true
Так что я могу получить их, используя curl, но тогда мне нужно их отфильтровать.
Я хочу что-то похожее на:
2009 12 02 Event from calendar 1's description
2009 12 03 Event from calendar 2's description
2009 12 04 Event from calendar 1's description
2009 12 05 Event from calendar 3's description
2009 12 06 Event from calendar 1's description
Однако даты в каналах календаря форматируются следующим образом:
<title type='html'>Event from calendar 1's description</title><summary type='html'>When: Fri 5 Dec 2008<br>
Так как мне отфильтровать даты и описания и преобразовать даты?
(у меня установлен cygwin, так что что-то, использующее perl или sed / awk, было бы идеально, так как я достаточно знаком с ними, чтобы быть уверенным в их изменении в будущем, но я открыт для предложений.)