Как конвертировать текст ANSEL в UTF-8 - PullRequest
3 голосов
/ 11 декабря 2008

Как изменить текст, закодированный в ANSEL, в UTF-8 в C #?

Ответы [ 3 ]

3 голосов
/ 11 декабря 2008

Это нетривиальное преобразование, поскольку в Windows / .NET Framework нет кодовой страницы ANSEL. См. здесь для ознакомления с страданиями другого человека, пытающегося это преобразование.

1 голос
/ 22 августа 2009

Существует класс AnselEncoding (производный от стандартного класса Encoding), доступный как часть Gedcom.NET на http://sourceforge.net/projects/gedcom-net/, который также включает поддержку некоторых расширений LDS.

1 голос
/ 17 декабря 2008

Джошперри прав. Сайт Эйхмана содержит в основном ЕДИНСТВЕННУЮ документацию, которая пытается объяснить кодировку ANSEL. К сожалению, там нет кода программы, поэтому вам придется кодировать его самостоятельно.

Существует еще одна таблица кодов (датированная декабрем 2007 года - я не знала, что кто-то все еще заинтересован) для ANSEL по адресу: http://lcweb2.loc.gov/diglib/codetables/45.html, с которой стоит сравнить работу Эйхмана, поскольку он признал, что было несколько кодов он не уверен в этом.

Если вас интересует генеалогическая точка зрения, стандартная версия 5.5 GEDCOM имеет сокращенный набор символов ANSEL и некоторые кодировки в приложении D .


Обновление, сентябрь 2017 года. Вскоре после моего первоначального ответа на этот вопрос Тамура Джонс написал замечательную серию статей об ANSEL, которые стоит проверить:

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...