В моем приложении я импортирую текст в базу данных из файлов, которые пользователи загружают на сайт.
База данных SQL Server 2005, текст хранится nvarchar
столбец, я использую EF и L2SQL.
Пользователи должны создавать свои файлы с помощью UTF-8, но, к сожалению, некоторые из них, очевидно, использовали другую кодировку. В результате некоторые символы являются недопустимыми.
Я бы хотел узнать, какие записи действительны. Я использую utf8checker . Он отлично работает с оригинальными файлами, но когда текст из базы данных, IsUtf8
метод всегда возвращает true.