Можно ли использовать прогнозирующее моделирование только для одной проблемы или нескольких проблем? - PullRequest
1 голос
/ 13 июня 2011

Я наткнулся на компанию, которая делает моделирование с предикативным поведением, и они говорят

Потому что наши прогнозирующие модели настроенный на ваш уникальный бизнес требования и обстоятельства, они может применяться к широкому спектру прогнозирование и прогнозирование деятельности через многочисленные типы проблем и Домены

Я хочу знать, запрограммированы ли модели Predicive уникально для каждой задачи или они запрограммированы один раз и используются везде. Я немного смущен

1 Ответ

1 голос
/ 13 июня 2011

Это варьируется: у вас может быть прогностическая модель, которая сильно оптимизирована, чтобы действительно хорошо работать с конкретным набором данных, используя преимущества вещей, которые специально известны для данных. Например, если вы выполняете анализ URL-адресов, и каждый URL-адрес представляет собой строку (до 255 символов), каждый символ (UTF 8) составляет 8 бит или 1 байт, поэтому вам потребуется 255 байтов для хранения каждого URL-адреса. Вы можете хэшировать каждый URL с помощью функции хеширования, такой как CityHash64, и теперь вы сможете хранить URL с 8 байтами вместо 255 байтов. Это можно встроить в алгоритм, чтобы использовать меньше памяти, что позволило бы разместить больше данных в оперативной памяти и ускорить вычисления, но такого типа оптимизация не может быть выполнена для системы, которая предназначена для поддержки различных типы данных. В общем случае у вас недостаточно знаний в предметной области, чтобы проводить такие оптимизации.

На «противоположном» конце, где, по-видимому, находится эта компания, вы бы предоставили общую систему, которая принимает данные в определенном формате и применяет к данным предопределенный алгоритм. У вас могут быть некоторые параметры, которые позволят вам настроить систему на случай, если вы получите больше знаний о предметной области, но это будет совсем не похоже на взятие хеша URL-адреса, чтобы уменьшить использование памяти на 3000%. Компании, которые предлагают такие услуги , обычно , применяют принцип DRY , они кодируют один раз и используют код столько, сколько могут (чтобы сэкономить деньги и максимизировать прибыль). Они могут вносить незначительные оптимизации или изменения в свои настройки, но обычно избегают кодирования алгоритма только для определенного клиента.

Это ни в коем случае не точное представление о том, что делает компания, на которую вы смотрите, но на основании вашей цитаты это выглядит как верное предположение. Точно так же, как люди понимают, что я не осуждаю суждение: имеет смысл, если эта компания обобщает, если мой бизнес зависел от того, чтобы я обслуживал как можно больше клиентов, я бы тоже обобщил.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...