У меня Pandas DataFrame
из missing dataframes
от большего dataset
. Столбец web_id
содержит ids
, отсутствующие в larger dataframe
.
Я пытаюсь найти шаблон по тому, как они отсутствовали в большем dataset
.
Например, следующий код воспроизводится на вашем локальном компьютере. Ниже приведен образец моего набора данных на данный момент:
pd.DataFrame({
"web_id": [43291, 43300, 43313, 43316, 43335, 43345, 43346, 43353, 43361, 43373, 43383, 43387, 43416],
"date": "12/17/2019"
})
Я полагаю, что в пропусках есть какие-то закономерности. Как я могу найти последовательность web_id
, чтобы понять, как отсутствовали данные из большего dataset
?
Большое спасибо заранее