База данных вопросов с однозначными числовыми ответами - PullRequest
14 голосов
/ 19 апреля 2010

Я (и со-хакеры) создаем своего рода игру пустяков, вдохновленную этим сообщением в блоге: http://messymatters.com/calibration. Идея состоит в том, чтобы дать доверительные интервалы и научиться калиброваться (когда вы «уверены на 90%», вы должны быть правы в 90% случаев).

Таким образом, мы ищем, в идеале, тысячи вопросов с однозначными числовыми ответами. Кроме того, они не должны быть слишком скучными. Существует множество случайных статистических данных, например, о закрытой акватории в разных странах, что может сделать игру невероятной. Такие вещи, как даты выхода классических фильмов, более интересны (для большинства людей).

Другие интересные из них, которые мы нашли, включают олимпийские рекорды, средние доходы по различным профессиям, даты известных изобретений и возрасты знаменитостей. Кстати, я решил задать этот вопрос, как указано выше. Очистить таблицы HTML с заданного URL в CSV

Итак, если вам известны другие источники интересных числовых фактов (в разбираемой форме), я с нетерпением жду указателей на них. Спасибо!

Ответы [ 11 ]

5 голосов
/ 30 мая 2010

Категория видеоигр

vgchartz.com имеет различные графики для названий видеоигр и производительности оборудования.

Примеры запросов:

Для таких вопросов достаточно данных:

  • Сколько оборудования / названия X было продано в год Y / первую неделю продаж?
  • Название X превосходит Название Y (в соответствующие первые N недель продаж) на сколько / какое соотношение?

Категория популярной музыки

billboard.com - это все, что вам нужно.

Ссылки на Википедию

Помимо показателей продаж, вы также можете задавать вопросы о позициях на графике, например ::1010 *

  • В категории Y диаграммы Z, где находится песня X / сколько песен у исполнителя X?

Максимально эффективное использование ваших данных

Вы можете сделать однозначный числовой Q / A из большинства списков. Возьмем, к примеру, список вроде TIME.com Все время 100 романов

Некоторые общие вопросы, которые можно задать:

  • Сколько написано в данный период времени?
    • Десятилетие, год, президентство Джорджа Буша, до 11 сентября и т. Д.
  • Какой разрыв в звании между Титулом X и Титулом Y?
    • Подобные парные запросы действительно максимально эффективно используют ваши данные!

Вы можете сделать это с любым списком Top 100:


История категории

historyorb.com это только один пример. URL и HTML очень удобны.

Есть много похожих сайтов, например brainyhistory.com .

Вы также можете использовать эти даты для «скрещивания» с другими данными (например, приведенный выше пример «100 лучших романов»).


Категория фильма

База данных фильмов в Интернете - это, конечно, ... База данных фильмов в Интернете !

3 голосов
/ 19 апреля 2010

Вся статистика, которая вам когда-либо понадобится ...


В Интернете доступно несколько "открытых" баз данных.

http://unstats.un.org/unsd/databases.htm

Просто извлеките из них свои данные, и вы уже в рабочем состоянии !!

ПРИМЕЧАНИЕ. Возможно, вы захотите кэшировать каждый Вопрос после его извлечения для последующего повторного использования (другим пользователем).

Удачи !!

CVS @ 2600Hertz

2 голосов
/ 01 июня 2010

Спортивные мелочи вполне подойдут для этого, поскольку вы можете задать тонну вопросов, которые 1) имеют однозначные числовые ответы и 2) некоторые люди на самом деле заботятся. Я знаю, что загружаемая база данных для статистики бейсбола существует , и я был бы удивлен, если бы вы не могли найти аналогичные базы данных и для других основных (и не очень) видов спорта. Вам все равно придется выбирать, потому что есть такая вещь, как слишком много мелочей, даже для фанатов непокорного спорта («Сколько вычеркнуло [неясного кувшина] в 1923 году?»), Но это должна быть насыщенная среда к моему.

2 голосов
/ 01 июня 2010

Что ж, если вы хотите задать такие вопросы, как " Какова численность населения страны X? ", " Какова самая высокая гора в Европе? ", тогда это может быть ваш выбор:

http://www.dbis.informatik.uni -goettingen.de / Mondial /

База данных MONDIAL была скомпилирована из географических веб-источников данных перечисленные ниже:

  • CIA World Factbook,
  • предшественник глобальной статистики, собранной Йоханом ван дер Хейден.
  • дополнительные текстовые источники для координат,
  • Международный Атлас Кюммерли и Фрея, Рэнда МакНалли и Вестермана,
  • и некоторые географические данные базы данных Karlsruhe TERRA.
2 голосов
/ 29 мая 2010

Вы можете попробовать постучать в парадную дверь:

Гранты Pioneer: гранты Pioneer доступны для стартапов и других разработчиков, создающих инновационные приложения с помощью Wolfram | Alpha API.

(http://products.wolframalpha.com/api/pricing.html)

2 голосов
/ 27 мая 2010

Касса Моджо - это отличный пример того, сколько знаменитых фильмов собрали. Я думаю, что люди находят это интересным.

1 голос
/ 03 июня 2010

WolframAlpha может быть хорошим местом для поиска числовых данных во всех видах категорий.

1 голос
/ 03 июня 2010

Статистика крикета. Популярный среди миллионов людей по всему миру, и все доступны из невероятной базы данных на http://www.cricinfo.com. Настоятельно рекомендуем

Также справочник ЦРУ: https://www.cia.gov/library/publications/the-world-factbook/

содержит всевозможные полезные числовые факты о странах и тому подобное.

1 голос
/ 03 июня 2010

Мировые факты (криминал, экономика, еда и т. Д.)

http://www.nationmaster.com/facts.php

Знаете ли вы? (Факты | Быстрые факты | Животные | История | Списки | Новости | Фобии)

http://didyouknow.org/

1 голос
/ 27 мая 2010

Вопросы в этой игре идеально подходят для того, что мы имеем в виду:

http://en.wikipedia.org/wiki/Wits_and_Wagers

Интересно, как создатели Wits & Wagers собрали эти вопросы ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...