изменение формы данных / перестановка в R - PullRequest
0 голосов
/ 04 июля 2019

Меня попросили изменить структуру данных для коллеги, и я потратил немало времени, пытаясь выяснить это, но я не могу решить ее проблему.Поэтому я создал небольшой пример для получения помощи от сообщества Stackoverflow

Примеры фреймов данных (код приведен ниже):

trial = пример данных

final_example = подмножество ожидаемыхрезультаты

Цель состоит в том, чтобы перейти от формата строки к столбцу, определить параметры, которые следует учитывать при выполнении этого перехода (подсчет отдельных лиц), и, наконец, вычислить кривую выживания Каплана-Мейера, как только это изменение формы данных будет выполнено (я уже закодировалкривая выживания Каплана Мейера).Мне нужна помощь в изменении данных.

В испытании df есть столбец «обработка» с 4 уровнями, где каждая обработка повторялась несколько раз (некоторые повторялись больше / меньше, чем другие).Каждое повторное лечение назначали различным «клеткам» с «индивидуумами» в этих клетках.

Данные брались один раз в день, начиная с "дня 0" до "дня 13" в нашем примере.Реальный набор данных превышает 70+ дней

. При каждой ежедневной записи данных определялось, нужно ли удалять человека из эксперимента или нет.Если человек был исключен из эксперимента, он был определен как данные «S» или «D», следовательно, почему у пробной версии df «Day 0_S» или «Day 1_D», и мы исключим все данные «A» из нашегоокончательный набор данных. Если данные были взяты, независимо от "S" или "A", это означает, что человек был удален из эксперимента

Мы храним информацию только там, где данные не были 0. Например,первая клетка TeA имеет данные в день 0, и ничего больше до дня 3. Final_example df отображает это, где день 1 и день 2 были исключены.

Важно объединить в хронологическом порядке лиц, которые были удалены в одной клетке.Если мы используем тот же пример с клеткой TeA: в день 0 был удален 1 человек, названный TeA_01.На 3-й день в той же клетке были удалены 3 человека, поэтому это будут TeA_02, TeA_03 и TeA_04. Эта часть очень сложная для меня, чтобы кодировать .

Данные "S" или "D" имеют определенную категорию в последнем столбце с именем "status", где:

S = 1 D = 0

Надеюсь, этот вопросясно, а если нет, пожалуйста, не стесняйтесь просить разъяснений.

Спасибо сообществу Stackoverflow!:)

В прошлом я опубликовал несколько вопросов о реформировании фреймов данных и исследовал такие опции, как функции collect () и mutate (), но

trial <- read.table("https://pastebin.com/raw/BLwHDr0X", header=T, sep="\t")

colnames(trial)[1] <- "treatment"

colnames(trial)[2] <- "cage"

final_example <- read.table("https://pastebin.com/raw/ffeKNRr1", header = T, sep="\t")

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...