Рассчитать пропорции дубликатов идентификаторов, используя R - PullRequest
0 голосов
/ 16 октября 2019

введите описание изображения здесь

БЛОК ID10

180050110003088, 180050110003088, 180050110001057, 180050110001057, 180050111001053, 180050111001053, 18005011500000001000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000, 180050111006001, 180050111006001, 180050115002017, 180050115002017, 180050102001023, 180050102001023, 180050102001024, 180050102001024, 180050102004129, 180050102004129, 180050102001008, 180050102001008, 180050113001051, 180050113001051, 180050106003001, 180050106003001, 180050115004073, 180050115004073, 180050108004013, 180050108004013, 180050101001132, 180050101001132, 180050110001053, 180050110001053, 180050110001115, 180050110001115, 180050101004075

Площадь формы

20,584551, 44,661716, 11,715119, 8,264571, 17,644236, 4,224248, 1,967708, 3,471188, 4,873869, 3,419209, 2,88, 2 898 975, 85755755, 28755, 28755, 28755, 178, 859, 85005, 28755, 850050001.447128, 1.731923, 1.447128, 1.731923, 5.348266, 1.447128, 1.447128, 1.731923, 4.873869, 3.419209, 3.419209, 1.788985, 23.476536, 15.001075, 5.348266, 9.943958, 1.447128, 1.731923, 17.644236, 8.264571, 4.484065, 1.731923, подробные данные * 101 * 94 *, данные * 101 * 94 *, данные * 101 * 231, данные * * 101 * 9, * * * *. на изображении ссылка

У меня есть фрейм данных с полем BLOCKID10 с дублированными значениями, но их области SHape разные. То, что я пытаюсь сделать, это суммировать области повторяющихся значений и делить сумму с их индивидуальным значением (в основном, вычисляя пропорцию), а затем заполнять пропорцию в новом столбце. Некоторые значения не повторяются, поэтому пропорция для них будет равна 1.

Как мне решить эту проблему?

Я пробовал dplyr и другие методы, но они выдают ошибку. Используется для вложенных циклов, но это занимает много времени, поскольку общее количество прогонов превышает 1,3 млрд.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...