У меня есть CSV-файл с именем Qid-NamedEntityMapping.csv, содержащий данные, подобные этим:
Q1000070 b'Myron V. George'
Q1000296 b'Fred (footballer, born 1979)'
Q1000799 b'Herbert Greenfield'
Q1000841 b'Stephen A. Northway'
Q1001203 b'Buddy Greco'
Q100122 b'Kurt Kreuger'
Q1001240 b'Buddy Lester'
Q1001867 b'Fyodor Stravinsky'
Второй столбец кодируется как «ascii», и когда я читаю файл, используя следующий код, тогдатакже он не читается должным образом:
import chardet
import pandas as pd
def find_encoding(fname):
r_file = open(fname, 'rb').read()
result = chardet.detect(r_file)
charenc = result['encoding']
return charenc
my_encoding = find_encoding('datasets/KGfacts/Qid-
NamedEntityMapping.csv')
df = pd.read_csv('datasets/KGfacts/Qid-
NamedEntityMapping.csv',error_bad_lines=False, encoding=my_encoding)
Но вывод выглядит так:
Также я попытался использовать кодировку = 'UTF-8'.но, тем не менее, вывод остается прежним.Что можно сделать, чтобы правильно его прочитать?