Мой оригинальный вопрос (решение в конце)
Я удалил указанные c строки из моих метаданных, которых не было в моем файле альфа-разнесения в R. Это два из моих фреймов данных. Затем я объединил их, используя слияние и столбец, которым они поделились, который был идентификатором. Однако, что странно, так это то, что одна из категорий для одной из переменных (вода как категория в переменной, называемой видами), все еще отображается в блокпосту (но пусто) или в среднем (но как NA). Я дважды проверил мой файл, и все образцы воды были удалены. Может кто-нибудь помочь мне разобраться в проблеме?
Удаление лишних строк из моих метаданных
metadata<-read.delim2("../../metadata/20190304-sample-metadata-v3v4.txt")
colnames(metadata)[1]<- "SampleID" # Change the first column name
metadata <- metadata[-c(21:23,25, 36), ]
Файл альфа-разнесения
shannon = read.table("shannon_vector_nNC/alpha-diversity.tsv", header = T)
shannon <- tibble::rownames_to_column(shannon, "SampleID")
# Преобразовать имена строк в столбец shannon<-merge(shannon, metadata, by="SampleID")
# Объединить этот файл с файлом метаданных
Рассчитать средние значения для каждого вида
tapply(shannon$shannon, shannon$Species, mean)
Виды1 Виды2 Виды3 Виды4 Вода 2.667927 3.270748 3.473404 3.333535 NA
Обновление
Я выяснил, в чем проблема. Проблема состояла в том, что категории были удалены, но уровни Видов фактора все еще были там. Я исправил это, используя следующий код:
Удалить дополнительный уровень
shannon$Species <- droplevels(shannon$Species)