В кадре данных с большими значениями в евро (€) я обнаружил три трудности:
1º Символ евро не читается, интерпретируется программой как ¬¬.Я пропустил его с
gsub("€", "", nombrevariable)
2º. Я хотел бы заменить запятые на документы, чтобы позволить R их распознать.Будучи большими цифрами и опуская первую точку, т.е.ценности.При заказе
summary()
R выполняет среднее, медиану и квартили, но я не могу сделать это сам, R возвращает мне значение NA.
Я хотел бы знать, что я мог с этим сделать.
Другие вещи, которые я пробовал при загрузке файла, это добавить dec = ","
или сделать это с помощью read.csv2
, я даже добавил stringsAsFactors = F
, но все еще невозможно.
И последний, я пытался загрузить данные в Excel.R поменяй себя "," на "." И дай мне summary()
.Но также я не могу использовать rowSums
или что-то в этом роде.
Первые строки моего .csv: введите описание изображения здесь
И мои коды:
datos <-read.csv ("datos.csv ", header = T, stringsAsFactors = F, sep =", ") </p>
данные $ subvencion <-gsub (" € "," ", данные $ subvencion) данные $ costes.salariales<-gsub (",", ", данные $ costes.salariales) данные $ costes.laborales <-gsub (", ",", данные $ costes.laborales) </p>
данные$ subvencion <- sub (".", "", datos $ subvencion, fixed = TRUE) данные $ subvencion <- sub (".", "", datos $ subvencion, fixed = TRUE) данные $ subvencion <- sub (",", ".", datos $ subvencion, fixed = TRUE) datos $ subvencion <-as.numeric (datos $ subvencion) </p>
colSums (datos [, "subvencion"])
Ошибка в colSums (datos [, "subvencion"]): 'x' должен быть массивом как минимум из двух измерений
И когда я запрашиваю сводку, он отвечает:
сводка (datos $ subvencion) Мин.1 кв.Медиана Среднее 3 кв.
Макс.127094 197829 235085 351821 376482 3164334 1
И еще:
colSums (datos [, "subvencion", drop = FALSE])
Ответ:
subvencion NA
Заранее спасибо и извините за мой английский.