Проблема с кодировкой UTF-8 при попытке чтения файла json - PullRequest
0 голосов
/ 04 августа 2020

У меня ошибка, показанная ниже, при попытке прочитать файл json с кодировкой UTF-8, может кто-нибудь знает, как я могу решить эту проблему?

reviews = pd.read_csv('reviews.csv', nrows=1000)
businesses = pd.read_csv('businesses.csv', nrows=1000)
checkins = []
with open('checkins.json', encoding='utf-8')  as f:
    for row in f.readlines()[:1000]:
        checkins.append(json.loads(row))
---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
<ipython-input-10-4f54896faeca> in <module>
      3 checkins = []
      4 with open('checkins.json', encoding='utf-8')  as f:
----> 5     for row in f.readlines()[:1000]:
      6         checkins.append(json.loads(row))

~\Anaconda3\lib\codecs.py in decode(self, input, final)
    320         # decode input (taking the buffer into account)
    321         data = self.buffer + input
--> 322         (result, consumed) = self._buffer_decode(data, self.errors, final)
    323         # keep undecoded input until the next call
    324         self.buffer = data[consumed:]

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xda in position 37: invalid continuation byte
...