SQL - это язык запросов, а не процедурный язык, поэтому, если вы не будете играть с PL / SQL или чем-то подобным, ваши примеры будут манипулировать данными.
Так вот что для меня было забавным - интеллектуальный анализ данных!Перейдите по адресу:
http://usa.ipums.org/usa/
и загрузите свои микроданные (вам нужно будет зарегистрироваться, но это бесплатно).
Вам нужно будет написать небольшой скрипт для вставки файла с фиксированной шириной в вашу базу данных, что само по себе должно быть весело.И вам нужно будет написать небольшой скрипт для автоматического создания полей (поскольку их много) на основе анализа их метафайла.Это тоже весело.
Тогда вы можете начать задавать вопросы.Предположим, что вопросы касаются цен на жилье:
Скажем, вы хотите взглянуть на динамику цен на жилье среди тех, кто имеет доходы в 10% населения за последние 40 лет.Затем ограничьте, если они живут в Калифорнии.Посмотрите, есть ли корреляция между доходом и долей ипотечных платежей в процентах от дохода.Затем сгруппируйте это по географическому региону.Затем посмотрите, есть ли корреляция между этими областями с самым высоким ипотечным бременем и процентом единиц, занятых арендаторами.Ваш БД будет иметь некоторые встроенные статистические функции, но вы всегда можете запрограммировать и свои собственные - поэтому корреляция может быть эквивалентом Фибоначчи.Затем напишите небольшой сценарий, чтобы сделать то же самое в R, импортируя данные из вашей базы данных, манипулируя им и сохраняя результат.
Лучший способ узнать о БД - это использовать их для каких-то других целей.
Как только вы закончите играть с iPUMS, взгляните на данные GEO с (в зависимости от вашей базы данных) чем-то вроде PostGis - единственное отличие состоит в том, что iPUMS дает вам разрешение с точки зрения трактов, тогда как данные ГИСимеет координаты широты / долготы.Затем вы можете построить тепловую карту ипотечного бремени для США и развить эту тепловую карту в разных временных масштабах.