Разрыв между WRDS Python API и ручным извлечением CSV-файлов в WRDS - PullRequest
0 голосов
/ 05 апреля 2019

Я знаю, что это действительно специфично для WRDS, и я не уверен, что кто-нибудь может мне помочь, но я подумал, что я мог бы также попробовать:

Я озадачен следующим, и это продолжает происходить для всех запросовЯ делаю в моей тестовой среде.Хотя я хотел бы запрашивать данные WRDS непосредственно из моего интерпретатора Python, я, похоже, не получаю те же данные, что и при извлечении файла CSV вручную на вашем веб-сайте.

Конкретный пример: у меня есть список в общей сложности 713 gvkeys, извлеченных из компонентов S & P500 (исторический> = 01/01/2010 -> пришлось делать это тоже вручную, потому что таблица не отсортирована по дате,Тем не менее, на сайте WRDS вы можете выбрать временные диапазоны // любая идея, как это сделать с помощью python & raw sql?).Для этого списка gvkeys я хочу получить финансовые коэффициенты из wrdsapps.firm_ratio в заданный период времени, например так:

fin_ratios = db.raw_sql("""
                  SELECT gvkey, permno, public_date, ptb, bm
                  FROM wrdsapps.firm_ratio
                  WHERE gvkey in %(gvkeys)s
                  AND public_date >= '01/01/2010'
                  """, params = parm)
fin_ratios.gvkey.nunique()

Это дает мне только 121 уникальный gvkeys.Если я выполню то же упражнение вручную через страницу запроса WRDS (со списком gvkeys в виде файла .txt), я получу данные по 646 из первоначальных 713 компаний.Что я не так делаю?

То же самое происходит со мной с другими таблицами db &, такими как crsp.ccmxpf_lnkhist для того же списка gvkeys.

Кроме того, еще кое-что, что меня интересует:Когда я выполняю запрос, который я разместил выше, через API Python, я получаю таблицу, в которой, как я уже сказал, только 121 gvkeys, но я также получаю столбец с соответствующими ему значениями permnos (!). Я не получаю permnos, если я делаю это вручнуюсайт WRDS, и вместо этого ему пришлось пройти через (довольно утомительную) базу данных СКК, чтобы связать данные о финансовом соотношении с данными о ценах CRSP.

Есть ли разница между этими двумя процедурами и почему permnos не отображаются в файлах csv, загруженных вручную из WRDS?

Я очень ценю вашу помощь.Спасибо!

...