Проблемы с чтением грязного файла CSV в R - PullRequest
0 голосов
/ 27 апреля 2020

Я пытался прочитать CSV в R. CSV странным образом разделен, и все значения в одном столбце разделены запятыми, как на этом рисунке this picture. Верхняя строка - это имена столбцов, а затем - значения. Когда я пытаюсь read_csv("filename"), в таблице не отображается ничего, кроме набора значений NA, как на этом рисунке, после запуска функции просмотра enter image description here. Как я могу подойти к этому?

Вот данные для справки

, Calories, Fat (g), Carb. (g), Fiber (g), Protein (g)
Chonga Bagel,300,5,50,3,12
8-Grain Roll,380,6,70,7,10
Almond Croissant,410,22,45,3,10
Apple Fritter,460,23,56,2,7
Banana Nut Bread,420,22,52,2,6
Blueberry Muffin with Yogurt and Honey,380,16,53,1,6
Blueberry Scone,420,17,61,2,5
Butter Croissant,240,12,28,1,5
Butterfly Cookie,350,22,38,0,2
Cheese Danish,320,16,36,1,8
Chewy Chocolate Cookie,170,5,30,2,2
Chocolate Chip Cookie,310,15,42,2,4
Chocolate Chunk Muffin,440,21,60,2,7
Chocolate Croissant,330,18,38,1,6
Chocolate Hazelnut Croissant,390,22,43,2,7
Chocolate Marble Loaf Cake,490,24,64,2,6
Cinnamon Morning Bun,390,15,56,2,8
Cinnamon Raisin Bagel,270,1,58,3,9
Classic Coffee Cake,390,16,57,1,5
Cookie Butter Bar,360,23,36,0,2

1 Ответ

2 голосов
/ 27 апреля 2020

Используйте следующий код для чтения данных

df = read.csv("starbucks-menu-nutrition-food.csv", skipNul = T)

head(df, 2)

        ÿþ Calories Fat..g. Carb...g. Fiber..g. Protein..g.
1 Chonga Bagel      300       5        50         3          12
2 8-Grain Roll      380       6        70         7          10

Тогда вы можете рассмотреть возможность переименования столбцов, например, например

colnames(df) <- c("Food", "Calories", "Fat", "Carb", "Fiber", "Protein")

для дальнейшей обработки данных.

...