Является ли мой путь изучения интеллектуального анализа данных правильным - PullRequest
3 голосов
/ 13 сентября 2010

Кто-то только что сказал моему боссу, что интеллектуальный анализ данных может сделать для компании, такой как рекомендации, прогнозное моделирование.В основном мы веб-сайт компании.Я собираюсь в отпуск на 6 месяцев.Итак, мой босс сказал, что я могу изучить некоторые методы DM, чтобы, когда я вернусь, мы могли посетить небольшие магазины или небольшие компании, чтобы предоставить им прогнозные данные, используя алгоритмы интеллектуального анализа данных.

В магазинах будут только файлы sqlили CSV-файлы для клиентов или более.

Теперь я знаю только MYSQL и не знаю, что такое интеллектуальный анализ данных и работает ли он так, как я думаю выше, я имею в виду, возможно ли, что у кого-то есть база данных клиентов, покупки и я могу применить технику интеллектуального анализа данных.Я имею в виду

(raw mysql or sql data) or (csv files) ----data mining--> (some useful result)
  • 1) Является ли вышеуказанная система правильной или я ошибаюсь
  • 2) Хотят ли магазины или предприятия иметь это или я что-то упускаю

Мой план их изучения в следующем порядке.Я подумываю сначала получить сертификат SQL Server 2008, потому что в моем регионе большинство используют Microsoft, поэтому, может быть, мне нужно знать sql

1)MCTS: SQL Server 2008, Implementation and Maintenance
2)MCTS: SQL Server 2008, Database Development
3)MCTS: SQL Server 2008, Business Intelligence Development and Maintenance

(или я должен пойти для оракула и хранилища данных оракула ...Сначала я хочу правильно выполнить некоторые операции с базой данных)

4)Data Mining with Microsoft SQL Server 2008 (2009)     
5)Python for dummies    
6)Programming Collective Intelligence: Building Smart Web 2.0 Applications

Мой поток правилен или я могу достичь своего результата лучше.Причина, по которой я делаю сертификат, заключается в том, чтобы получить некоторое представление о SQL, и в случае, если я не получу эту работу через 6 месяцев, я смогу приступить к новой работе, связанной с интеллектуальным анализом данных, BI или, по крайней мере, сервером SQL.

Пожалуйста, помогите мне

Ответы [ 4 ]

0 голосов

Из того, что вы написали, это близко к интеллектуальному анализу данных, но не к очистке данных.

Прежде всего, ответ Нгу Вскоре Хуэй отвлекает вас в совершенно неверном направлении.
То, что он вам посоветовал, называется копирование данных , но не извлечение данных .
Вы бы лучше поняли разницу между интеллектуальным анализом данных и очисткой данных (например, очистка веб-сайтов или веб-страниц или очистка данных):

"(необработанные данные MySQL или SQL) или (CSV-файлы) ---- интеллектуальный анализ данных -> (некоторый полезный результат)"

Просто полностью забудьте о MySql и не тратьте на это время, потому что в MySql абсолютно отсутствует поддержка сбора данных. Только для очистки данных. Хотя вы можете быть заинтересованы в последнем. Ты лучше знаешь разницу

"1) MCTS: SQL Server 2008, Внедрение и техническое обслуживание 2) MCTS: SQL Server 2008, разработка баз данных 3) MCTS: SQL Server 2008, Бизнес Развитие интеллекта и Техническое обслуживание "

Зачем вам 1) и 2)? Даже 3) содержит только 20% данных.

5) Python для чайников 6) Программирование Коллективный разум: строительство Приложения Smart Web 2.0

Зачем вам нужен Python?

6) не является анализом данных. Это называется очисткой данных, и это снова путь в совершенно неверном направлении от DM

0 голосов
/ 13 сентября 2010

Похоже, вы все делаете неправильно.

Самое важное - это изучить темы интеллектуального анализа данных, искусственного интеллекта и прогнозирования, все эти хардкорные материалы по математике и CS.Не технология базы данных, которая хотя и важна, но не очень связана с областями интеллектуального анализа данных.

Есть одна книга, которую я бы порекомендовал, и я думаю, что она адаптирована к вашим потребностям: Программирование Коллективный разум .

alt text

0 голосов
/ 13 сентября 2010

Хорошо, это не простой ответ ДА ​​/ НЕТ.Вы делаете что-то правильно.Таким образом, вы узнаете набор инструментов SQL Server Data Mining.И вы поймете, какой алгоритм использовать где.(Как будет Наивный Byes. Отличается от дерева решений .. и т. Д.)

Как только вы узнаете этот материал, вторая вещь узнает ваши данные и как сделать таблицы FLAT, которые будут служить в качестве входных данных.Это наиболее важно, потому что именно эти данные вы будете использовать для обучения своих моделей.Вам не нужно знать внутреннюю математику за алгоритмом ANN и так далее.Вы должны просто знать, как его использовать.Существуют надстройки для интеллектуального анализа данных для Excel (начиная с 2007 года), с которыми можно поиграть.

На сайте http://channel9.msdn.com от Rafal Luckawiski есть несколько видеороликов для сбора данных.Они хороши для того, чтобы дать некоторое представление о том, как начать.

После этого это вопрос практики, и чем больше вы будете играть с новыми данными и создавать новые модели и анализировать результаты, тем лучше вы станете.

Дайте мне знать, если вам нужно большеинформация о PPT, образцах и т. д.

0 голосов
/ 13 сентября 2010

Э-э, для эффективного извлечения данных вам нужно знать лот математических данных. Твой путь похож на «я хочу быть хирургом, поэтому я научусь резать скальпелем». Да, знание некоторого SQL и, возможно, это необходимо (зависит только от того, как организованы ваши данные), но FAR достаточно.

...