Карта Уменьшить, чтобы получить самые популярные теги - PullRequest
0 голосов
/ 20 сентября 2011

У меня есть проблема, по которой мне нужна помощь, но я чувствую, что я рядом. Он включает в себя литий и код MongoDB выглядит следующим образом: http://pastium.org/view/0403d3e4f560e3f790b32053c71d0f2b

$db = PopularTags::connection();

        $map = new \MongoCode("function() {
            if (!this.saved_terms) {
                return;
            }

            for (index in this.saved_terms) {
                emit(this.saved_terms[index], 1);
            }
        }");

        $reduce = new \MongoCode("function(previous, current) {
            var count = 0;
            for (index in current) {
                count += current[index];
            }
            return count;
            }");

        $metrics = $db->connection->command(array(
           'mapreduce' => 'users',
           'map' => $map,
           'reduce' => $reduce,
           'out' => 'terms'
       ));

        $cursor = $db->connection->selectCollection($metrics['result'])->find()->limit(1);
        print_r($cursor);
/**
User Data In Mongo

{
 "_id" : ObjectId("4e789f954c734cc95b000012"), 
"email" : "example@bob.com", 
 "saved_terms" : [
    null,

    [
        "technology",
        " apple",
        " iphone"
    ],
    [
        "apple",
        " water",
        " beryy"
    ]
] }


**/

У меня есть пользовательские условия экономии, которые они ищут, и затем я пытаюсь получить наиболее популярные термины. но я продолжаю получать сообщения об ошибках: Uncaught исключение «Exception» с сообщением «MongoDB :: __ construct (неверное имя»). Кто-нибудь знает, как это сделать или какое-то направление?

1 Ответ

1 голос
/ 25 сентября 2011

Во-первых, я бы не стал хранить это в объекте пользователя.У объектов MongoDb верхний предел составляет 4/16 МБ (в зависимости от версии).Теперь этот предел обычно не является проблемой, но при входе в систему в одном объекте вы можете достичь его.Однако более реальная проблема заключается в том, что каждый раз, когда вам нужно воздействовать на эти объекты, вам нужно загрузить их в оперативную память, и это становится потребляющим.Я не думаю, что вы хотите, чтобы на ваших пользовательских объектах.

Во-вторых, массивы в объектах не сортируются и имеют другие ограничения, которые могут вернуться к вам позже.

Но, если вы хотите иметьэто так (небольшой объем поисков не должен быть проблемой на самом деле), вы можете решить эту проблему проще всего, используя групповой запрос.Групповой запрос во многом похож на групповой запрос в SQL, так что это небольшая хитрость, так как вам нужно сгруппировать что-то, что разделяет большинство объектов.(Возможно, активное поле для пользователей).

Итак, вот пример рабочей группы, которая будет суммировать слова, используемые на основе вашей структуры.Просто поместите этот метод в вашу модель и выполните MyModel :: searchTermUsage (), чтобы вернуть объект Document.

public static function searchTermUsage() {
    $reduce = 'function(obj, prev) {
        obj.terms.forEach(function(terms) {
            terms.forEach(function(term) {
                if (!(term in prev)) prev[term] = 0;
                prev[term]++;
            });
        });
    }';
    return static::all(array(
        'initial' => new \stdclass,
        'reduce' => $reduce,
        'group' => 'common-value-key' // Change this
    ));
}

В поле term нет защиты от типов, не являющихся массивами(у вас было нулевое значение в вашем примере).Я удалил его для простоты, лучше удалить его, прежде чем он попадет в базу данных.

...