Я хочу загрузить данные в R - PullRequest
0 голосов
/ 29 февраля 2012

Я использую readLines("file.txt") для чтения в R. Я получаю символьный вектор:

[1]"classLabel|UserName|2|1.857|Subejct|User Questio(text)n?|Answer(text).|text"

, но я хотел продолжить его обработку, чтобы иметь его в качестве фрейма данных

col1       col2      col3  col4  col5    col6     col7    col8
classLabel  usrName    2  1.857  Subject User Q   Answer   text

Формат файла |с разделителями и есть 8 атрибутов.

classLabel|UserName|2|1.857|Subejct|User Questio(text)n?|Answer(text).|text

Также, если вы можете поделиться некоторыми учебниками или ресурсами для загрузки данных в R было бы очень полезно

Ответы [ 3 ]

3 голосов
/ 29 февраля 2012

Как сказал lokheart, вы захотите использовать read.table. Документация довольно хорошая ... наберите ?read.table в командной строке R, чтобы увидеть справку, в конце приведены примеры.

Что касается учебных пособий, то в Интернете доступно несколько учебных пособий. Вы должны проверить этот вопрос SO для некоторых превосходных ссылок, а также официальное введение языка R на веб-сайте R.

3 голосов
/ 29 февраля 2012

Вы можете попробовать read.table

read.table("file.txt",sep="|")

0 голосов
/ 03 мая 2018

В R есть несколько способов загрузки наборов данных в формате csv, txt или других форматах. Один из способов - использовать read.table, для чего вы выполните следующий код:

setwd("Directorypath") ##remember use "//" if you are using a Windows OS

Ваш путь к каталогу будет примерно таким:

"C:\\firstfolder\\secondfolder"

Если в вашей базе данных есть заголовок, вы можете использовать следующие параметры для импорта набора данных:

dataset <- read.table("FileName", sep=",", header=T)

Однако, как я уже сказал, существует множество способов импорта данных в R. Другой пример - использование read.csv

read.csv("FileName", sep=",", header=T)

Или использование пакета readxl для чтения файлов Excel:

read_excel("FileName", sheet="nameofsheet")

Несмотря на то, что последний способ требует больше времени для загрузки, поскольку увеличивает размер базы данных, рекомендуется использовать форматы csv для обработки ваших данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...