Я пытаюсь проанализировать RSS-каналы Twitter и поместить информацию в базу данных sqlite, используя Python. Вот пример:
MiamiPete: today's "Last Call" is now up http://bit.ly/MGDzu #stocks #stockmarket #finance #money
Я хочу создать один столбец для основного контента (Miami Pete…now up
), один столбец для URL (http://bit.ly/MGDzu
) и четыре отдельных столбца для хэштегов (акции, фондовый рынок, финансы, деньги). Я играл с тем, как это сделать.
Любой совет будет принята с благодарностью!
P.S. Ниже приведен пример кода, с которым я играл выше. :)
def store_feed_items(id, items):
""" Takes a feed_id and a list of items and stored them in the DB """
for entry in items:
c.execute('SELECT entry_id from RSSEntries WHERE url=?', (entry.link,))
tinyurl = entry.summary ### I added this in
print tinyurl.split('http') ### I added this in
if len(c.fetchall()) == 0:
c.execute('INSERT INTO RSSEntries (id, url, title, content, tinyurl, date, tiny) VALUES (?,?,?,?,?,?,?)', (id, entry.link, entry.title, entry.summary, tinyurl, strftime("%Y-%m-%d %H:%M:%S",entry.updated_parsed), tiny ))