У меня есть два кадра данных в python, и я хочу сделать из них декартово произведение.Для этого я использовал слияние с той же ключевой командой, как указано ниже:
print("dna", df_genes.size)
print("names",df_citations.size)
df_genes['key'] = 0
df_citations['key'] = 0
df = pd.merge(df_genes, df_citations, on='key').drop('key', axis = 1)
print("df before",df.size)
Однако при каждом запуске я получаю разный размер для декартового произведения - и это никогда не умножение первых двух кадров данных.Например, в последнем прогоне я получил:
('dna', 7437309)
('names', 165)
('df before', 490862394)
(Как видите, разница довольно большая)
Это звучит странно для меня.У кого-нибудь есть подсказка?