Как запустить импорт леса mlcp с сервера приложений - PullRequest
1 голос
/ 07 марта 2019

У меня установлен mlcp (v9.0.4) на сервере приложений. Подключение к базе данных DB1 на сервере базы данных (ML v 9.0.4)

Обратите внимание: леса DB1 находятся в / data / db_data / Forests / forest1 DB2прослушивает порт 1111

Я пытаюсь запустить следующие на сервере приложений

./mlcp.sh import -mode local -host DBSERVER -port 1111 -user uname -password xxx -input_file_path file:///DBSERVER/data/db_data/Forests/forest1 -input_file_type forest

леса DB1 для лесов DB2 (обе базы данных работают на одном хосте).

mlcpКажется, он ищет путь на сервере приложений вместо DBSERVER и, следовательно, выдает ошибку: Путь к входному файлу не существует.Какой правильный способ сделать это?

Я могу сделать копию mlcp, но хотел подтвердить:

  1. эта опция не работает
  2. mlcp копия кажется медленнееиз-за заданных условий фильтрации.

Прямой вопрос: каков наилучший способ переноса данных из одной базы данных контента в другую базу данных контента?Копия MLCP делает это, но это слишком медленно от меня.

1 Ответ

0 голосов
/ 13 марта 2019

Ответ на вопрос из вашего комментария: Каков наилучший способ переноса данных из одной базы данных контента в другую базу данных контента на том же хосте / кластере.

Я предполагаю, что это будет одинвремя или нечастый процесс.Одним из методов будет создание лесов реплик для DB1.После синхронизации лесов удалите реплики и назначьте их DB2.Этот метод должен быть намного быстрее, чем MLCP.

И похоже, что основная причина, по которой ваш MLCP не работал, была вызвана некоторыми ограничениями MLCP.Из документов ( Ограничения прямого доступа ):

Когда вы используете mlcp с прямым доступом, ваши лесные данные должны быть доступны с хостов, обрабатывающих ввод.В распределенном режиме леса должны быть доступны с узлов в кластере Hadoop.В локальном режиме леса должны быть доступны с хоста, на котором вы выполняете mlcp .

...