У меня есть много векторов числительных c данных, некоторые из которых содержат пробелы. Я должен определить, являются ли эти разрывы смежными или распределены более или менее случайным образом в каждом векторе. Пример, подобный этому, проиллюстрирован здесь:
# Let's create a couple of data vectors
x <- runif(1000)
y <- runif(1000)
# Let's add some NAs at random to x
x[sample(c(1:1000), 100, replace = F)] <- NA
# Let's add some continuous NAs to y
y[c(251:350)] <- NA
# And get the respective summaries
summary(x)
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
0.00294 0.24446 0.51441 0.50535 0.76200 0.99850 100
summary(y)
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
0.00325 0.22178 0.47765 0.48207 0.73380 0.99969 100
То есть и x, и y имеют одинаковое количество пробелов, но в x они распределены случайным образом по вектору, а в y они агрегированы. Я должен обнаружить это, любая идея?