Я разбираю форму отчета amazon, разбиваю строки на поля и затем создаю mysql загрузку. Данные, которые я считаю, изначально iso-8859-1. Данные загружаются нормально до mysql, если в них нет специальных символов, таких как Ä или ®. Если это произойдет, я получаю сообщение об ошибке типа pymysql.err.InternalError: (1366, "Incorrect string value: '\\xAE Kids...' for column 'item-name' at row 74")
& TypeError: can only concatenate str (not "bytearray") to str
. Я могу взломать его, сделав замену байтов, но я не хочу создавать гигантский список, плюс я действительно хочу хранить правильные значения. Я пытался изменить свои mysql наборы символов и сопоставления, но это не помогло. Я чувствую, что это простое исправление, но я уже пробовал несколько часов.
report_as_dict = report.parsed
report_as_dict = report_as_dict.replace(b' \r\n', b'\r\n') # remove black space at end
multi_line_rebuild=list()
for line in line_split[1:]:
field_split = line.split(b'\t')
logger.debug('Field Split : %s', field_split)
field_split = [x.replace(b'\x92', b'') for x in field_split] # removes single quotes
field_split = [x.replace(b'\xA0', b'') for x in field_split] # removes (
field_split = [x.replace(b'\xAE', b'') for x in field_split] # removes @
field_split = [x.replace(b'\xCD', b'l') for x in field_split] # replaces l with ' with l
field_split = [x.replace(b'\xE4', b'a') for x in field_split] # replaces a with two dots with a
multi_line_rebuild.append(field_split)
....
run_query_with_warnings(query_string, field_split=multi_line_rebuild)
Функция
def run_query_with_warnings(warn_type, query_string, **kargs):
db = MySQLdb.connect(host=cred.host, user=cred.user, password=cred.password, db=cred.db, port=cred.port)
cursor = db.cursor()
cursor.executemany(query_string, kargs['field_split'])