У меня есть текстовый файл президентских дебатов. В конце концов, я хочу проанализировать текст в фрейме данных, где каждая строка является оператором, с одним столбцом с именем докладчика и другим столбцом с оператором. Например:
"Bob Smith: Hi Steve. How are you doing? Steve Brown: Hi Bob. I'm doing well!"
станет:
name text
1 Bob Smith Hi Steve. How are you doing?
2 Steve Brown Hi Bob. I'm doing well!
Вопрос: Как мне отделить утверждения от имен? Я попытался разделить на двоеточие:
data <- strsplit(data, split=":")
Но потом я получил это:
"Bob Smith" "Hi Steve. How are you doing? Steve Brown" "Hi Bob. I'm doing well!"
Когда то, что я хочу, это:
"Bob Smith" "Hi Steve. How are you doing?" "Steve Brown" "Hi Bob. I'm doing well!"