Я импортирую CSV-файлы в MySQL, используя LOAD DATA с CHARACTER SET UTF8MB4. Чаще всего это работает, но время от времени я все еще получаю сообщения об ошибках вроде этого:
ОШИБКА 1300 (HY000): Неверная строка символов utf8mb4: '楽 天 市場 を み'
Похоже, что есть еще китайские иероглифы, которые не работают, и я понятия не имею, почему. Эти персонажи находятся вне utf8mb4? Как это можно сделать?
Редактировать: При открытии CSV с Notepad ++, кажется, есть «невидимая» часть после китайских букв, не уверен, если это причина или китайские буквы до: 楽 天 市場 をみ xE3x82