У меня есть требование в моем текущем проекте, я получаю данные из исходной базы данных Oracle и загружаю их в каталог назначения HDFS в виде файла CSV через репликацию данных Oracle goldengate.При каждом выполнении задания мне нужно проверять данные из HDFS и таблицы Hive, которые являются точными и согласованными.Каков будет лучший способ сделать это?Пожалуйста, дайте мне знать.