Создание 0 записей для пропущенных значений в последовательности дат в Excel или R - PullRequest
0 голосов
/ 23 октября 2019

Example image

Привет, Сообщество,

Я добавил больше контекста ниже, но мой вопрос сводится к:

Есть ли в R или Excel функция, которая может вставить определенное значение (0) для отсутствующих записей в последовательности в другом столбце? Помните, что это не числовая последовательность, а последовательность дат.

Контекст: Я изо всех сил пытался исправить базу данных, которая содержит информацию о размере рынка. Поскольку это внутренние данные, я не могу поделиться исходным файлом, поэтому я добавил изображение примера. Исходный файл - только пример, но гораздо больше.

Сейчас я даже не знаю, какой инструмент использовать, и даже какую функцию я мог бы использовать. Если SO не подходит для того, чтобы спросить это, не могли бы вы сообщить мне подходящее место.

Описание данных: У меня есть рабочий лист с размером рынкаопределенных продуктов в месяц для нескольких стран. Пример (строка 2): в январе 2018 года (столбец B) размер рынка Албании для яблок составлял 100 кг. Данные содержат информацию за период с 2018 по 2019 год, а также данные о нескольких странах и продуктах.

Цель: Иметь полный файл долей рынка на все периоды, продукты и даты.

Проблема: Иногда даты пропускаются.
В этом примере отсутствуют размеры рынка Гондураса в период с февраля (02) по май (04) 2018 года. Записи не существуют в исходном файле, но это не означает, что размер рынка не существует. Вместо этого это означает, что размер рынка за этот период, для этого конкретного продукта, для этой конкретной страны был равен 0.

Решение, которое я пытаюсь найти: Создание записей о размере рынка, равных0 для этих пропущенных периодов.

Что я пробовал : Моей первой попыткой было исправить это в Таблице, пытаясь ввести 0 в пропущенных полях, но потом я понял, что Таблица неидеально подходит для этой работы, а также я понял, что проблема не в том, что записи NA, а вместо этого, что нет записей. Пример таблицы

Итак, я перешел в Excel, где я попытался сначала определить места, в которых отсутствует информация.
Основной отсутствующий идентификатор ТеперьЯ знаю, где находятся отсутствующие данные, но я понятия не имею, как создавать записи на основе того, равен или нет столбец E отсутствующим.

Наконец я понял, что должен попытаться использовать R, потому что естьболее 400 000 записей, и каждое вычисление, которое я делаю в Excel, занимает много времени, если сначала не происходит сбой программного обеспечения. Тем не менее, я даже не уверен, как начать решать эту проблему с R.

Заранее спасибо за любую помощь! Если кто-нибудь сначала скажет мне, какой инструмент использовать, и, возможно, некоторые функции, которые могут создавать записи для пропущенных значений в последовательности, у меня уже будет с чего начать.

Если вы считаете, что мой подход полностью отключен, тогда позвольте мнея тоже это знаю.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...