На подкасте Stackoverflow на этой неделе Джефф упомянул, что в 2004 году он написал скрипт, который запросил у Google 110 000 английских слов и собрал базу данных, содержащую количество совпадений для каждого слова. Они используют это на Stackoverflow, например. для списка «Связанные» в правой части каждой страницы вопроса.
Поскольку создание одного из них сегодня с подобным сценарием было бы затруднительным (как упоминал Джоэл, «при 30 000 слов вы постучали в вашу дверь»), мне было интересно, если кто-нибудь знает о более современном, бесплатная база данных частот слов Google (например, для слов ИТ, которые с тех пор наверняка изменились, таких как jquery, ruby, azure и т. д.).