Есть ли у меня более быстрый способ подсчета всей частоты всех элементов в 2-мерном массиве? Как этот образец:
var array = [["a", "b"]["c", "d"]["b", "d"]["c", "a", "b"], ["a", "b", "c", "d"];
Мой ожидаемый результат будет массив объектов, содержащих ключевое слово и значение частоты.
Вот так
result = [{ keyword: "a",
frequency: 3
}, {
keyword: "b",
frequency: 4
}, ... ];
Вот мое решение:
function generateData (records) {
var data = [];
for (var i = 0; i < records; ++i) {
data.push(["a", "b", "c", "d", "e"]);
}
// some gap to insert data
setTimeout(function () {
}, Math.random() * 1000);
return data;
}
function mine (data) {
var result = [];
data.forEach( function (keywords) {
for (var i = 0, len = keywords.length; i < len; ++i) {
var pos = result.map( function (x) {
return x.keyword;
}).indexOf(keywords[i]);
if (pos == -1) {
var newKeyword = {
keyword: keywords[i],
frequency: 1
}
result.push(newKeyword);
} else {
result[pos].frequency += 1;
}
}
});
return result;
}
var dataset = generateData(50000);
var start = performance.now();
var result = mine(dataset);
var end = performance.now();
console.log(result);
console.log("Total time: " + (end - start) + " milliseconds.");
У кого-нибудь есть более быстрый способ решить эту проблему?
Примечание. С двумерным массивом ключевых слов (около 50 000 записей).