перевести файл данных с нечетной еврейской кодировкой - PullRequest
1 голос
/ 21 октября 2010

У меня есть файл двоичных данных в формате, используемом относительно древней программой, который я пытаюсь преобразовать во что-то вменяемое. С помощью редактора Hex я в основном разработал формат файла, за исключением того, что он содержит ивритские символы с нечетной кодировкой.

Все символы 8 бит. «Стандартные» 27 согласных (включая «конечные» согласные) идут от гекса до 80А. Тогда есть гласные, которые, кажется, начинаются с гекса 9B или около того (я думаю, сразу после окончания стандартных согласных). Тогда есть «пунктирные» согласные, которые, кажется, начинаются в шестнадцатеричном E0.

Если я правильно помню, я думаю, что это какая-то кодировка DOS. Что это за кодировка и какую кодировку я должен перевести, чтобы пользователь в Израиле мог легче всего открыть ее, скажем, в Microsoft Word? Есть ли какие-нибудь инструменты, которые я мог бы использовать для перевода?

1 Ответ

1 голос
/ 21 октября 2010

80 до 9A, похоже, соответствуют кодовым точкам в CP862 , но я не смог найти соответствия для кодовых точек гласных.Я думаю, что вам нужно просто настроить пользовательское отображение на Unicode и произвести вывод в текстовом файле UTF-8 или UTF-16LE.Если вы добавите спецификацию (Byte-Order-Mark), Блокнот и / или Word смогут читать ее без проблем.Я бы, вероятно, сделал небольшой скрипт на Python, но это не должно быть сложно на любом другом языке.

...