Почему отсортированные данные перестраиваются при построении графика? - PullRequest
0 голосов
/ 26 апреля 2020

Первоначально кадр данных, df, был отсортирован. Я предполагаю, что это строка, но я смог отсортировать вектор alphanumeri c:

df <- df[mixedorder(as.character(df$ID)),]

При создании диаграммы в порядке (ось X) возвращается к 1 10a 10b 11, хотя я явно изменил порядок на 1 2 3 4 5

Ответы [ 2 ]

1 голос
/ 26 апреля 2020
library(tidyverse)

df <- data.frame(ID=(c("1", "2", "3", "4", "5", "10a", "10b", "11")), 
                 y=c(seq(100,500,100), 150, 155, 180), stringsAsFactors = FALSE)

Простое исправление для простых данных

df$numId<-1:nrow(df)

ggplot(df, aes(x=reorder(ID,numId), y = y)) +
  geom_col() +
  labs(x='ID', y='Value')

Результат

enter image description here

Создание функции для создания числа c значение

create_id<-function(x) {
  if(!grepl('[a-z]',x,ignore.case = TRUE)) {
    return(as.numeric(x))
  } else {
    letter<-tolower(gsub('[0-9]+',"",x))
    letter_value<-which(letters==letter)/100
    number<-as.numeric(gsub('[a-z]',"",x)) + letter_value
    return(number)
  }
}

df<-df %>%
  group_by(ID, y) %>%
  mutate(nid = round(create_id(ID),3))

ggplot(df, aes(x=reorder(ID,nid), y = y)) +
  geom_col() +
  labs(x='ID', y='Value')

Результат

enter image description here

Спасибо пользователю @ user12728748 за ответ, а также за предоставление кода кадра данных. Мой ответ только здесь, чтобы удовлетворить тег ggplot2 в вопросе. Ответ выше также подходит.

1 голос
/ 26 апреля 2020

Вы, похоже, имеете дело с факторами, или вектором символов, который приводится в алфавитно отсортированном факторе при построении графика, поэтому вы превращаете его в фактор, если он еще не является фактором, и переупорядочиваете уровни факторов, а не сортируете data.frame по ID:

df <- data.frame(a=factor(as.character(c(1, 2, 3, 10, 11, 20, 21, 22))))
df <- data.frame(ID=factor(c("1", "2", "3", "4", "5", "10a", "10b", "11")), 
                 y=c(seq(100,500,100), 150, 155, 180))
df <- df[order(df$ID), ]
df$ID
#> [1] 1   10a 10b 11  2   3   4   5  
#> Levels: 1 10a 10b 11 2 3 4 5
df <- df[gtools::mixedorder(as.character(df$ID)),]
df$ID
#> [1] 1   2   3   4   5   10a 10b 11 
#> Levels: 1 10a 10b 11 2 3 4 5
barplot(y~ID, data=df)

df$ID <- factor(df$ID, levels=levels(df$ID)[gtools::mixedorder(levels(df$ID))])
barplot(y~ID, data=df)

Создано в 2020-04-26 представленный пакет (v0.3.0)

  • отредактирован с учетом повторного выравнивания коэффициента для устранения введенных ошибок.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...