Не уверен, поможет ли это, но кодовая страница тамильского языка "57004 - ISCII Tamil" поддерживается Windows.
Хотя это не дает тот же перевод для приведенного выше примера символа.Для «ஹ» это дает 216. Возможно, нужно использовать другую кодовую страницу?
string tamilUnicodeString = "ஹ";
Encoding encoding = Encoding.GetEncoding("x-iscii-ta");
byte[] codepageBytes = encoding.GetBytes(tamilUnicodeString);
Обновление
Если вы хотите взять файл Unicode в качестве вводатранслитерируйте символы, чтобы получить однобайтовое представление, следующее должно сделать свое дело.Полученный массив должен иметь ваше однобайтовое представление, если ваш словарь кодирует каждый символ:
Dictionary<char, char> lookup = new Dictionary<char, char>
{
{ 'ஹ', '\x86' },
{ 'இ', '\x87' },
//next pair...,
//etc, etc.
};
string input = "ஹஇதில் உள்ள தமிழ் எழுத்துக்கள் சரியாகத் தெரிந்தால்";
char[] chars = input.ToCharArray();
for (int i = 0; i < chars.Length; i++)
{
char replaceChar;
if (lookup.TryGetValue(chars[i], out replaceChar))
{
chars[i] = replaceChar;
}
}
byte[] output = Encoding.GetEncoding("iso-8859-1").GetBytes(chars);