Фрейм данных, импортированный из Excel, обрабатывает "<" как NA - PullRequest
0 голосов
/ 08 января 2019

Я импортирую большой набор числовых данных в R из Excel. Данные являются числами химического состава, и у меня часто есть значения, например, «<1». Каждый раз, когда в кадре данных появляется «<1», R считывает / выводит его как NA. </p>

Похоже, что это делается при чтении файла Excel, поэтому мои попытки использовать gsub для замены "<" на "" не работают, так как число с самого начала не обрабатывается как число. </p>

Я бы хотел получить эти данные и иметь все, что "<1", просто будет "1". Но, как я уже сказал, он импортируется как NA, и я не знаю, что делать. </p>

Я довольно плохо знаком с R, поэтому, пожалуйста, имейте в виду мою ограниченную способность четко определять мою проблему.

Заранее спасибо!

1 Ответ

0 голосов
/ 08 января 2019

читать столбец как символ / текст

пример данных (./test.xlsx)

enter image description here

код

df <- readxl::read_excel( "./test.xlsx", sheet = 1, col_types = c("text") )
df
# number
#   <chr> 
# 1 1     
# 2 2     
# 3 3     
# 4 <1    
# 5 3 

#post-processing
library( dplyr )
df %>% mutate( number = gsub("<", "", number ) %>% as.numeric )
# # A tibble: 5 x 1
#   number
#    <dbl>
# 1      1
# 2      2
# 3      3
# 4      1
# 5      3
...