Как вписать страну в глобальную сеть населения? - PullRequest
0 голосов
/ 03 марта 2020

Имеют следующие данные о населении в сетке (доступно из базы данных истории глобальной среды, HYDE) ftp: //ftp.pbl.nl/../hyde/hyde3.1/hyde31_final/1980ad_pop.zip

Это выглядит так:

ncols 4320
nrows 2160
xllcorner -180
yllcorner -90
размер ячейки 0,0833333
nodata_value -9999
-9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 - 9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 - 9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 - 9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 - 9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 - 9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999 -9999

Суммирование:

  • Сетки начинаются с -90 широты и -180 долготы и охватывают весь мир.
  • -9999 обозначает пустую ячейку сетки или необитаемую область.
  • Положительные целые числа указывают количество жителей в этой ячейке сетки.

Я хочу использовать эти данные для создания базы данных со страной в качестве идентификатора. Цель состоит в том, чтобы создать нечто похожее на «центральные точки административных единиц с оценками численности населения», доступные в «Gridded Population of World (GPW), v4» https://sedac.ciesin.columbia.edu/data/set/gpw-v4-admin-unit-center-points-population-estimates-rev11/metadata В этой базе данных каждая страна представлена ​​несколькими (иногда сотни) административных единиц. Ниже примере 8 административных единиц из Австрии:

тысяча тридцать один * COUNTRYNM NAME1 NAME2 NAME3 CENTROID_X CENTROID_Y UN_2000_E тысяча тридцать-три * Австрия Бургенланд Mittelburgenland Оберпуллендорф Кайзерсдорф +16,38512988 +47,53693633 523 тысяча тридцать пять * Австрия Бургенланд Mittelburgenland Оберпуллендорф Nikitsch +16,64790172 +47,52716896 1585 1037 Нордбургенланд Маттерсбург Лойперсбах им Б ~ 16.47012631 47.70209712 1279

Австрия Бургенланд Нордбургенланд Нойзидль-ам-Зее Антау 16.48452882 47.77712371 757

Австрия Бургенланд Нордбургенланд Оберпуллендорф Зурндорф * 475 * * 92 География c координаты (л широта и широта соответственно). UN_2000_E - расчетная численность населения с поправкой на WPP ООН на 2000 год.

Проблема заключается в том, что эти данные отсутствуют за годы, предшествующие 1990 . (Более ранняя версия GPW v3 включает данные о населении за 1990 и 95 годы, а не GPW v4, из которого получены вышеупомянутые данные.)

Тем не менее, подробные данные о населении доступны для данных до 1990 года в базе данных истории. глобальной окружающей среды (HYDE) - но без идентификатора страны . Мой год интереса - 1980, но есть данные и для ряда других лет. Цель операции - рассчитать взвешенные по населению страновые центры (они отличаются от географических c центров) до 1990 года.

Понятия не имею, как составить подробную базу данных о населении страны за период до 1990 года. Для упрощения мне не нужны номинальные данные внутри страны, т. Е. Данные не обязательно должны быть идентичны структуре GPW v3 или v4, в которой каждая административная единица идентифицируется по своему названию. Меня даже не интересуют административные единицы - но мне НУЖНЫ детальные данные о населении страны в том смысле, что

  • каждая страна представлена ​​несколькими единицами;

  • эти единицы являются ячейками сетки из HYDE;

  • , и каждая единица идентифицируется по долготе и широте плюс соответствующие данные о населении (количество жителей).

Это все, что мне нужно.

Одна потенциальная проблема, которую я вижу, заключается в том, что иногда границы пересекают ячейки сетки - в этом случае нельзя быть уверенным, относится ли фигура в этой самой ячейке к этой или эта страна. Или, может быть, я ошибаюсь, и это не проблема.

Очень полезным ярлыком будет база данных, которая включает данные о населении по административным центрам (или любой другой разбивке, которая имеет смысл, например, ячейки сетки), идентифицируемой длинные и лат данные по странам. Но, по-видимому, до 1990 года такой базы данных не существовало: https://www.popgrid.org/data-docs-table1 Так что нужно строить ее из необработанных ("неопознанных") данных о населении.

...