Полезные стоковые наборы данных SQL? - PullRequest
16 голосов
/ 22 декабря 2010

Кто-нибудь знает какие-либо ресурсы, которые предоставляют хорошие, полезные наборы данных? Например, я скачал сценарий SQL, который включает в себя все штаты, города и почтовые индексы США. Это сэкономило мне много времени в недавнем приложении, где я хотел иметь возможность выполнять поиск по географии. Кто-нибудь из вас знает о других полезных наборах данных, которые свободно доступны для скачивания?

Например:

  • Черный список IP-адресов
  • Названия колледжей / университетов
  • Названия корпораций / биржевые символы

У кого-нибудь есть рекомендации?

EDIT:

В качестве примера, вот местоположение, где я нашел скрипт MySQL, содержащий все почтовые индексы США и соответствующие им широту / долготу. Кто-нибудь еще нашел такие же полезные наборы данных в SQL, которые можно легко импортировать и использовать?

http://www.chrissibert.com/blog/wp-content/uploads/2009/06/zipcodes.7z

РЕДАКТИРОВАТЬ 2:

Чтобы уточнить, о каких типах наборов данных я говорю ... Я имею в виду наборы данных, которые могут быть немедленно полезны для приложений, могут применяться в различных сценариях и обычно представляют информацию, которую легко найти. небольшие случаи, но сложнее компилировать для больших наборов данных. База данных почтового индекса - отличный пример для меня. Нетрудно получить лат / лонг для одного данного почтового индекса. Но получение значений для всех действительных почтовых индексов в США занимает немного больше времени. Эти данные также бесполезны для отдельной отрасли или сектора бизнеса, но могут применяться в различных приложениях.

Ответы [ 7 ]

6 голосов
/ 23 декабря 2010

Много ссылок, чтобы открыть наборы данных здесь:

http://readwrite.com/2008/04/09/where_to_find_open_data_on_the/

хотя я сомневаюсь, что любой из них сгенерирует для вас операторы SQL.

5 голосов
/ 23 декабря 2010

Shadowman , лучше, если вы скажете подробный список того, что вы хотите.

  • IP-адреса из черного списка - Ad? Xxx? Мошенничество
  • Названия колледжей / университетов - все в мире? Не будет ли это слишком много?

Вот идея, как выпустить список чего-то - вот как я это делаю:

Например, мне нужен список колледжей / университетов в Калифорнии.

  1. Я гуглю для: colleges california wikipedia. Затем откройте первый найденный предмет там;
  2. С помощью мыши я выбираю все колледжи и университеты оттуда в буфер обмена;
  3. Откройте Excel и вставьте скопированные имена в первую строку + столбец;
  4. Во второй ячейке первого ряда напишите шаблонный скрипт, например:

    ="INSERT INTO Colleges (state, name) VALUES ('CA', '" & RC[-1] & "');"
    

    Это должно дать что-то вроде

    INSERT INTO Colleges (state, name) VALUES ('CA', 'Academy of Art University, San Francisco');
    INSERT INTO Colleges (state, name) VALUES ('CA', 'Allied American University, Laguna Hills (Online)');
    INSERT INTO Colleges (state, name) VALUES ('CA', 'American Jewish University, Los Angeles');
    INSERT INTO Colleges (state, name) VALUES ('CA', 'American Sports University, San Bernardino');
    INSERT INTO Colleges (state, name) VALUES ('CA', 'Anaheim University, Anaheim (Online)');
    INSERT INTO Colleges (state, name) VALUES ('CA', 'Antioch University, Culver City');
    -- etc...
    
  5. Затем просто скопируйте сгенерированный скрипт и используйте его для своей базы данных
2 голосов
/ 23 декабря 2010

http://www.data.gov/ имеет много разных наборов данных, но большинство из них не являются "запасом".

1 голос
/ 31 июля 2015

РЕДАКТИРОВАТЬ: я оставлю свой предыдущий ответ.Если вы хотите преобразовать произвольный CSV в сценарии SQL для использования в базе данных, читайте ниже.В противном случае, База данных Chinook предлагает отличные примеры данных со сценариями, которые совместимы с различными реляционными базами данных .


Я искал образцы базовых наборов данных в стиле SQL, чтобы помочьнаучить друга, как делать запросы SQL.Некоторые из размещенных здесь ссылок больше не были доступны, поэтому я опубликую то, что я в итоге использовал.

Здесь есть несколько довольно интересных CSV-данных из SpatialKey .

Данные CSV можно использовать, если это то, что вам нужно, но я хотел получить данные в базе данных SQLite, поэтому я использовал этот удобный CSV-> SQL онлайн-конвертер .

После загрузки SQL я запустил следующее:

В оболочке:

sqlite3 <database_file>

В оболочке SQLite:

.load <path to SQL script file>
0 голосов
/ 10 мая 2015

На сайте документации MySQL есть список загружаемых наборов данных, уже в формате SQL, готовый для использования в базе данных.

  1. Загрузить набор данных, например мировую базу данных: http://downloads.mysql.com/docs/world_innodb.sql.gz
  2. Перейдите в папку, в которую вы скачали, например, cd Downloads
  3. Распаковать gunzip world_innodb.sql.gz
  4. Войдите в MySQL и создайте world базу данных

$ mysql mysql> create database world mysql> quit

  1. Импортировать содержимое файла mysqldump, используя cat

кошка world_innodb.sql | MySQL мир

Этот набор данных является идеей для учащихся, которые хотят практиковать свой SQL.

0 голосов
/ 03 октября 2014

Если вы ищете данные временных рядов, проверьте Quandl . Самое замечательное в этом то, что он имеет тонны различных наборов данных (запасы, экономика, здравоохранение, образование и т. Д.), Но все они доступны с помощью одного простого API RESTful. Если программирование не ваша вещь, то есть бесплатный плагин Excel, который позволяет легко собирать данные в электронную таблицу.

0 голосов
/ 30 декабря 2010

Фондовые символы проблематичны, они могут быть разными для каждого места исполнения сделки, и почти все они считаются защищенной интеллектуальной собственностью места или поставщика данных, например. Thomson Reuters, Bloomberg, Nasdaq, NYSE.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...