Для процента отсчетов лодок подходит распределение Пуассона. Он в основном выражает заданное количество событий, происходящих в фиксированное время. В вашем случае это может быть количество лодок, расположенных в определенном c месте (река Ганг) и время (в зависимости от вашего интервала). Здесь вы можете найти подробную информацию о распределении, а здесь вы можете найти простой учебник, как применить его к R.
Что касается корреляционной части, это также зависит от того, что вы хотел бы посмотреть. В вашем случае кажется, что население местоположения и процент лодки и простая линейная регрессия могут соответствовать. Здесь вы можете найти теоретические основы этого, а здесь вы можете найти, как применить его на R.