Здесь должно быть то, что вы ищете.Первый массив - просто http://unicode.org/Public/UNIDATA/Index.txt с заменой новых строк на |
;
// this mess..
var unc = "A WITH ACUTE, LATIN CAPITAL LETTER 00C1| /*... really big array ...*/ |zwsp 200B";
var uncs=unc.split("|");
var final_a = [];
var final_s = "";
for each (var item in uncs) {
var _T=item.split("\t");
//final_a [_T[1]] = _T[0];
final_s += '"' + _T[1] + '"' + ' : ' + '"' + _T[0] + '",';
}
console.log (final_s);
// yields..
var unicode_lookup = { /*really big array*/ }
// which we can use like so ...
alert(unicode_lookup["1D01"]);
// AE, LATIN LETTER SMALL CAPITAL
SO не сохраняет вкладки, поэтому первая часть может не работать, если вы просто скопируете и вставите его.Вы заметите, что некоторые символы являются дубликатами, поэтому вы можете захотеть сделать некоторую очистку.