Есть два файла Excel, которые совпадают только с некоторыми из столбцов.
Один Excel содержит дублирующиеся строки,
Я использовал 'функцию соответствия' и 'функцию semi_join' на основе общий столбец в Excel.
В результате было выведено количество различных строк.
Данные настолько велики, что не ясно, в чем разница.
Прошу вашего понимания о том, что данные не могут быть загружены.
Буду признателен, если вы обратитесь к изображению.
Короче говоря,
Если функция соответствия или semi_join используется на основе имени, из значения возвращаемого столбца B возвращается только первое значение.
Например, на приложенном рисунке, если имя a, возвращается только 2.