Иногда я импортирую данные из предоставленных мне CSV-файлов в таблицу mysql.
В последнем, что я сделал, некоторые записи имеют странный плохой символ перед фактическими данными, и они были импортированы в мою базу данных. Сейчас я ищу способ его почистить.
Неверные данные находятся в столбце mysql «электронная почта», кажется, что они всегда перед фактическими данными. При попытке распечатать его на моем экране с помощью PHP, он отображается как . При экспорте в файл CSV он выглядит как Â, и если я SET CHARACTER SET utf8
перед печатью на экране с использованием PHP, он выглядит как обычный пробел ''.
Я думал о написании PHP-скрипта, который просматривал бы все мои строки по одной, исправлял поле адреса электронной почты и обновлял строку. Однако я не совсем уверен насчет части «исправить электронную почту»!
Я подумал, может быть, сделать "взрыв" и использовать плохой символ в качестве разделителя, но я не знаю, как ввести этот символ в мой код.
Может быть, есть способ найти базовое значение / utf8 / hex или какой-либо другой символ, а затем найти его в строке?
Надеюсь, это достаточно ясно.
Спасибо
EDIT:
В Hex похоже, что это A0. Что я могу сделать, чтобы найти и удалить символ по его шестнадцатеричному значению? Думаю, в PHP или напрямую в MySQL ...