Мне нужна помощь в поиске решения для структурирования данных для использования с сетевым пакетом r?
У меня есть список author_list, содержащий несколько авторов на каждый символьный вектор, например ::100100
document_authors1 = c ("Кинг, Стивен", "Мартин, Джордж", "Клэнси, Том")
document_authors2 = c («Клэнси, Том», «Паттерсон, Джеймс», «Стин, Р.Л.», «Кинг, Стивен»)
document_authors3 = c («Клэнси, Том», «Паттерсон, Джеймс», «Стин, Р.Л.», «Кинг, Стивен»)
author_list = list (document_authors1, document_authors2, document_authors3)
author_list
[[1]]
[1] «Кинг, Стивен», «Мартин, Джордж», «Клэнси, Том»
[[2]]
[1] «Клэнси, Том», «Паттерсон, Джеймс», «Стайн, Р.Л.» "Король Стивен"
[[3]]
[1] «Клэнси, Том», «Паттерсон, Джеймс», «Стайн, Р.Л.» "Король Стивен"
Мне нужно создать фрейм данных на основе author_list, в котором есть три столбца. Первые два столбца имеют имена авторов, где col1 имеет значение строки одного автора, а col2 - значение строки другого автора, а третий столбец, называемый co -опроявлением, предоставляет частоту, с которой пара авторов (col1 и col2) Строка 1) встречаются. Например,
col1 col2 co-occurrence
1 King, Stephen Patterson, James 2
2 Martin, George Clancy, Tom 1
Etc ...
Я пытался найти функцию из пакета, чтобы сделать это, но не повезло. Я также пытался пошагово собрать решение, но, похоже, это намекает на меня. Надеюсь, это проще, чем я думаю. Буду признателен за любые советы или предложения.