Строки удаляются в R с read.table? - PullRequest
1 голос
/ 12 августа 2009

Я загружаю таблицу, в которой первый столбец является URL-адресом, и считываю его в R, используя read.table().

Кажется, что R отбрасывает около 1/3 столбцов и не возвращает никаких ошибок.

URL не содержат # символов или вкладок (мое поле-разделитель), что, как я понимаю, может быть проблемой. Если я сначала преобразую URL в целочисленные идентификаторы, проблема исчезнет.

Есть ли что-то в поле, что может привести к тому, что R отбросит строки?

Ответы [ 2 ]

2 голосов
/ 12 августа 2009

Без выборки данных сложно сказать. Но одна небольшая «ошибка» в том, что # является значением по умолчанию comment.char в read.table(). Попробуйте установить comment.char = "" и посмотреть, исправит ли это.

1 голос
/ 13 августа 2009

Спасибо за вашу помощь,

Да, поэтому изначально было несколько хэшей, и я смог обработать их, используя comment.char = ''. Проблема оказалась в том, что некоторые из моих URL содержали символы «и». Самое странное в этой ситуации - то, что она не возвращала ошибок. После удаления этих символов с помощью tr у меня не возникло проблем с загрузкой данных.

...