Получаемый вами "мусор" - китайский, но он по-прежнему кодируется как UTF-8, поэтому вы должны рассматривать его как необработанную строку байтов и декодировать ее.
С примером результата str
,
str = b'\xe4\xbd\xa0\xe5\xa5\xbd\xe5\x90\x97\xef\xbc\x9f'
print (str.decode('utf8'))
дает
你好吗?
, что произносится как "Ni hao ma?"а на китайском "как дела?"