Итак, ATF публикует отчеты вплоть до 2008 года по статистике трассировки по каждому штату. Мне нужно вытащить количество огнестрельного оружия, отслеженного из исходных состояний, перечисленных в PDF (см. PDF).
Это все годы, начиная с 2008 года, и я понятия не имею, как эффективно получить эти данные. Я пытался сделать это с помощью R, потому что это единственный язык программирования, с которым у меня есть опыт (см. Ниже).
txt <- pdf_text("https://www.atf.gov/about/docs/report/
colorado-firearms-trace-data-2014/download")
cat(txt[7])
Результаты ...
Top 15 Source States for Firearms with a Colorado Recovery
January 1, 2014 – December 31, 2014
25
27
27
19 23
1,762
71 28
25
45 60
26
97 22
44
NOTE: An additional 32 states accounted for 261 other traces.
The source state was identified in 2,562 total traces.
Bureau of Alcohol, Tobacco, Firearms and Explosives, Office
of Strategic Intelligence and Information
Кроме этого, я не смог найти в Интернете ничего, что могло бы помочь мне преобразовать эти данные в нечто вроде этого:
recovered year from weapons
colorado 2014 colorado 1762
colorado 2014 other 261
colorado 2014 washington 25
(and so on...)
Понимая, что это может быть связано с ограничениями R, я просто хочу знать, есть ли хороший источник, где я могу узнать, как разработать функцию для этого (возможно, в R). Особенно, прежде чем я попытаюсь напечатать это вручную или выучить новый язык с нуля (оба из которых я не уверен, смогу ли я найти время.)