R: как прочитать серию текстовых файлов в R как CSV, но сначала удалить первые три строки текстовых файлов - PullRequest
0 голосов
/ 07 июня 2011

У меня есть серия текстовых файлов.

У меня есть все эти имена файлов в CSV-файле X в столбце V1 (X $ V1), egatxt, b.txt ....

Текстовые файлы имеют следующий формат:

title:xxx
date:xxx
person-in-charge:xxx

sx2sa 333 444 666 ggge4
xatak eees 566 6763 gaeta

Я хочу получить data.frame следующим образом с R.

filename  column3 column5
a         444     ggge4
b         566     gaeta

Изучая другие ответы в stackoverflow:

Iдумаю, я могу использовать сканирование для чтения текстовых файлов.Тем не менее, после использования scan, как я могу прочитать в оставшемся тексте как CSV, разделенных тегом?

Я думаю, я могу использовать read.table или read.csv, и впоследствии удалить оставшийся текст,Я обнаружил, что не могу этого сделать, так как первые 3 строки текста не могут быть распознаны форматом csv или таблицей, все элементы теперь читаются и помещаются в первую строку кадра данных.Я использовал следующие командные строки, это источник проблемы:

x <- read.csv (file="a.txt", header=FALSE)
x <- read.table (file="a.txt", header=FALSE)

Я пропустил какие-либо важные инструменты в R?Я считаю, что есть разумный способ сделать все это эффективно с R, не могли бы эксперты в этой области дать мне еще комментарии или инструкции?Большое спасибо.

1 Ответ

4 голосов
/ 07 июня 2011

Вы можете использовать параметр skip, например:

> read.csv('a.txt', header=FALSE, skip=4, sep=' ')
     V1   V2  V3   V4    V5
1 sx2sa  333 444  666 ggge4
2 xatak eees 566 6763 gaeta

Чтобы объединить данные из нескольких файлов, вы можете использовать rbind для укладки фрейма данных друг на друга.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...