У меня сейчас проблема, связанная с текущими ограничениями на сервер, который наша команда не контролирует.
У нас есть работа, которую должна выполнять база данных, но мы вынуждены использовать файл XML и анализировать его с помощью Javascript / jQuery. У нас даже нет прав на запись для наших сценариев (только через нашу учетную запись FTP) ... нам не нравится говорить об этом, но это то, что мы получили.
Проблема, связанная с этими ограничениями, заключается в том, что нам необходимо проанализировать большой XML-файл размером около 500 КБ с 1700-кратными записями имени документа / номера / URL-адреса.
Число довольно сложное, например, "31-2b-1029E", смешанное с такими вещами, как "T2315342".
Итак, я решил, что мне нужно использовать что-то под названием «Natural Sort» (спасибо stackoverflow).
В любом случае я попытался использовать этот скрипт здесь:
/*
* Reference: http://www.overset.com/2008/09/01/javascript-natural-sort-algorithm/
* Natural Sort algorithm for Javascript - Version 0.6 - Released under MIT license
* Author: Jim Palmer (based on chunking idea from Dave Koelle)
* Contributors: Mike Grier (mgrier.com), Clint Priest, Kyle Adams, guillermo
*/
function naturalSort (a, b) {
var re = /(^-?[0-9]+(\.?[0-9]*)[df]?e?[0-9]?$|^0x[0-9a-f]+$|[0-9]+)/gi,
sre = /(^[ ]*|[ ]*$)/g,
dre = /(^([\w ]+,?[\w ]+)?[\w ]+,?[\w ]+\d+:\d+(:\d+)?[\w ]?|^\d{1,4}[\/\-]\d{1,4}[\/\-]\d{1,4}|^\w+, \w+ \d+, \d{4})/,
hre = /^0x[0-9a-f]+$/i,
ore = /^0/,
// convert all to strings and trim()
x = a.toString().replace(sre, '') || '',
y = b.toString().replace(sre, '') || '',
// chunk/tokenize
xN = x.replace(re, '\0$1\0').replace(/\0$/,'').replace(/^\0/,'').split('\0'),
yN = y.replace(re, '\0$1\0').replace(/\0$/,'').replace(/^\0/,'').split('\0'),
// numeric, hex or date detection
xD = parseInt(x.match(hre)) || (xN.length != 1 && x.match(dre) && Date.parse(x)),
yD = parseInt(y.match(hre)) || xD && y.match(dre) && Date.parse(y) || null;
// first try and sort Hex codes or Dates
if (yD)
if ( xD < yD ) return -1;
else if ( xD > yD ) return 1;
// natural sorting through split numeric strings and default strings
for(var cLoc=0, numS=Math.max(xN.length, yN.length); cLoc < numS; cLoc++) {
// find floats not starting with '0', string or 0 if not defined (Clint Priest)
oFxNcL = !(xN[cLoc] || '').match(ore) && parseFloat(xN[cLoc]) || xN[cLoc] || 0;
oFyNcL = !(yN[cLoc] || '').match(ore) && parseFloat(yN[cLoc]) || yN[cLoc] || 0;
// handle numeric vs string comparison - number < string - (Kyle Adams)
if (isNaN(oFxNcL) !== isNaN(oFyNcL)) return (isNaN(oFxNcL)) ? 1 : -1;
// rely on string comparison if different types - i.e. '02' < 2 != '02' < '2'
else if (typeof oFxNcL !== typeof oFyNcL) {
oFxNcL += '';
oFyNcL += '';
}
if (oFxNcL < oFyNcL) return -1;
if (oFxNcL > oFyNcL) return 1;
}
return 0;
}
И применяется с использованием:
// Natural Sort (disabled because it is super freaking slow.... need xsl transform sorting instead)
var sortedSet = $(data).children("documents").children("document").sort(function(a, b) {
return naturalSort($(a).children('index').text(), $(b).children('index').text());
});
Это отлично работает с другим нашим меньшим XML-файлом, но для гигантского 500-килобайтного файла Safari (v4) просто зависает на несколько минут, чтобы разобраться в этом, в то время как Firefox (последний) занимает около 10 секунд, чтобы процесс (все еще не хорошо, но по крайней мере в здравом уме).
Я также нашел этот другой меньший / более легкий скрипт под названием Alphanum :
function alphanum(a, b) {
function chunkify(t) {
var tz = [], x = 0, y = -1, n = 0, i, j;
while (i = (j = t.charAt(x++)).charCodeAt(0)) {
var m = (i == 46 || (i >=48 && i <= 57));
if (m !== n) {
tz[++y] = "";
n = m;
}
tz[y] += j;
}
return tz;
}
var aa = chunkify(a);
var bb = chunkify(b);
for (x = 0; aa[x] && bb[x]; x++) {
if (aa[x] !== bb[x]) {
var c = Number(aa[x]), d = Number(bb[x]);
if (c == aa[x] && d == bb[x]) {
return c - d;
} else return (aa[x] > bb[x]) ? 1 : -1;
}
}
return aa.length - bb.length;
}
Это работает быстрее для Safari, но все еще блокирует браузер на минуту или около того.
Я провел некоторое исследование, и, похоже, несколько человек рекомендовали использовать XSL для сортировки записей XML, что, по-видимому, намного быстрее из-за того, что он встроен в браузер, а не работает поверх JavaScript.
По-видимому, существует несколько различных реализаций, когда Сарисса упоминается несколько раз, а на странице sourceforge, по-видимому, указано, что последнее обновление произошло в 2011-06-22.
Есть и другие варианты, такие как xslt.js
Мой вопрос:
- Является ли XSL лучшим вариантом сортировки для этой конкретной проблемы?
- Если так, как я могу использовать XSL для естественной сортировки? (URL к ресурсам?)
- Если да на оба вопроса, какую библиотеку мне следует использовать для лучшей совместимости и скорости?
- Если XSL не лучший выбор, то какой?
Спасибо, что посмотрели на мою проблему.