Обработка большого количества данных с использованием облачных вычислений - PullRequest
0 голосов
/ 14 апреля 2011

Я работаю над проектом, в котором мне нужно обработать миллионы транзакций, и я ищу решение для облачных вычислений, которое поможет мне в этом. Я программист на C #, поэтому мне было интересно, Azure мой лучший выбор? Или у кого-нибудь есть рекомендации или книга / сайт для начала?

Большое спасибо, Энди,

1 Ответ

1 голос
/ 14 апреля 2011

Вы должны определенно прочитать что-то о Hadoop: http://hadoop.apache.org/
Рекомендуемая книга: http://www.amazon.com/Hadoop-Definitive-Guide-Tom-White/dp/0596521979
Коммерческая версия: http://www.cloudera.com/

Она обеспечивает основу для обработки большого количества неструктурированныхданные (MapReduce) (например, журналы), и это очень зрелое решение, используемое Yahoo, Facebook и многими другими: http://wiki.apache.org/hadoop/PoweredBy
Чистый SQL доступен с Hive,
Задания могут быть написаны на C # с использованием режима потоковой передачиHadoop имеет собственный API Java.

Amazon предоставляет хостинг Hadoop в облаке с помощью Amazon Elastic MapReduce (EMR): http://aws.amazon.com/elasticmapreduce/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...