У меня есть набор данных, который я хотел бы изменить для построения в виде сети ( после проделанной работы ).Исходный фрейм данных выглядит следующим образом:
authors <- c('Author A', 'Author B', 'Author C',
'Author A', 'Author D', 'Author C')
affiliation <- c('University 1', 'University 2', 'University 1',
'University 1', 'Institute 3', 'University 1')
manuscript <- c('Manuscript A', 'Manuscript A', 'Manuscript A',
'Manuscript B', 'Manuscript B', 'Manuscript B')
df <- data.frame(authors, affiliation, manuscript)
Я хотел бы изменить это так, чтобы для каждой рукописи я мог получить каждую комбинацию авторов с принадлежностью основного автора (надеюсь, что так и есть).Задавать этот вопрос имеет смысл).Это может привести к следующему кадру данных:
df_network <- data.frame('primary_author'= c('Author A', 'Author A',
'Author B', 'Author B',
'Author C', 'Author C',
'Author A','Author A',
'Author D', 'Author D',
'Author C', 'Author C'),
'connection'= c('Author B', 'Author C',
'Author A', 'Author C',
'Author A', 'Author B',
'Author D', 'Author C',
'Author A', 'Author C',
'Author A', 'Author D'),
'primary_affiliation' = c('University 1', 'University 1',
'University 2', 'University 2',
'University 1', 'University 1',
'University 1', 'University 1',
'Institute 3', 'Institute 3',
'University 1', 'University 1'),
'manuscript' = c('Manuscript A', 'Manuscript A',
'Manuscript A', 'Manuscript A',
'Manuscript A', 'Manuscript A',
'Manuscript B', 'Manuscript B',
'Manuscript B', 'Manuscript B',
'Manuscript B', 'Manuscript B'))
Конечно, я могу изменить данные вручную, но это невероятно утомительно, особенно потому, что список становится очень длинным.Я делал это раньше (вручную), и если я могу получить данные в форме df_network
, то результат будет довольно хорошим.Будем весьма благодарны за любые советы и рекомендации, которые может предложить любой.