Я пытаюсь разобрать тег заголовка в канале RSS 2.0 на три разные переменные для каждой записи в этом канале. Используя ElementTree, я уже проанализировал RSS, так что я могу напечатать каждый заголовок [минус конечный )
] с кодом ниже:
feed = getfeed("http://www.tourfilter.com/dallas/rss/by_concert_date")
for item in feed:
print repr(item.title[0:-1])
Я включил это, потому что, как вы можете видеть, item.title является типом данных repr (), о котором я не знаю много.
Определенный repr(item.title[0:-1])
print
ed в интерактивном окне выглядит так:
'randy travis (Billy Bobs 3/21'
'Michael Schenker Group (House of Blues Dallas 3/26'
Пользователь выбирает группу, и я надеюсь, после анализа каждой item.title
на 3 переменные (по одной для группы, места проведения и даты ... или, возможно, массива или я не знаю ...) выбрать только те, которые относятся к выбранной группе. Затем они отправляются в Google для геокодирования, но это уже другая история.
Я видел несколько примеров regex
, и я читаю о них, но это кажется очень сложным. Это? Я подумал, что, может быть, кто-то здесь будет иметь некоторое представление о том, как именно это сделать разумным образом. Должен ли я использовать модуль re
? Имеет ли значение, что выход в данный момент равен repr()
с? Есть ли способ лучше? Я думал, что буду использовать цикл вроде (а это мой псевдо-Питон, просто пишу заметки):
list = bandRaw,venue,date,latLong
for item in feed:
parse item.title for bandRaw, venue, date
if bandRaw == str(band)
send venue name + ", Dallas, TX" to google for geocoding
return lat,long
list = list + return character + bandRaw + "," + venue + "," + date + "," + lat + "," + long
else
В конце мне нужно, чтобы выбранные записи в файле .csv (с разделителями-запятыми) выглядели так:
band,venue,date,lat,long
randy travis,Billy Bobs,3/21,1234.5678,1234.5678
Michael Schenker Group,House of Blues Dallas,3/26,4321.8765,4321.8765
Надеюсь, это не так уж и много. Я буду изучать это самостоятельно, просто подумал, что я должен написать здесь, чтобы убедиться, что он получил ответ.
Итак, вопрос в том, как мне лучше всего разобрать каждый repr(item.title[0:-1])
в feed
в 3 отдельных значения, которые затем я могу объединить в файл .csv?