Есть много сообщений о разборе твиттера json, но ни один из тех, что я видел, не решил мою проблему.
Это код
import json
file = open('tweet', 'r')
tweet = file.read()
#{"geo":null,"text":"Lmao!! what time? I dont finish evening cleaning till 5 RT \u201c@some_user: football anyone?.....i wanna have a kickabout :(\u201d"}
#{"geo":null,"text":"Lmao!! what time? I dont finish evening cleaning till 5 RT @some_user: football anyone?.....i wanna have a kickabout :("}
def parseStreamingTweet(tweet):
try:
singleTweetJson = json.loads(tweet)
for index in singleTweetJson:
if index == 'text':
print "text : ", singleTweetJson[index]
except ValueError:
print "Error ", tweet
print ValueError
return
parseStreamingTweet(tweet)
Это тестовая программа. Твит приходит в поток, и для проверки я сохранил твит в файл и проверил. Существует отредактированная часть твиттера.
Может ли кто-нибудь сказать мне, как разобрать твит, которые имеют единый код? Первый твит в комментарии не кодируется, а второй - нет. Сначала возникает ошибка, при удалении строки uni-кода разбор успешен. Какое может быть решение?