MLCP с потоком данных - PullRequest
       10

MLCP с потоком данных

0 голосов
/ 07 сентября 2018

Не уверен, правильный ли это вопрос или нет ...

Requrement - Я собираюсь написать приложение, которое собирает огромные данные из внешней конечной точки REST, я хочу использовать MLCP для хранения этого потока данных, поступающих из внешней конечной точки REST в MarkLogic.

возможно ли использовать MLCP?

Пожалуйста, дайте ваши решения.

Ответы [ 2 ]

0 голосов
/ 08 сентября 2018

DMSDK (Data Movement SDK) может помочь удовлетворить ваши требования:

http://docs.marklogic.com/guide/java/data-movement

0 голосов
/ 07 сентября 2018

Если под «потоком» вы подразумеваете неограниченность в пространстве и времени, а под «огромным» вы подразумеваете multi GB +, то никакой MLCP не является правильным выбором или недостаточен.MLCP - это «командная» программа командной строки, вам нужно, чтобы все ваши данные уже были сохранены локально, прежде чем запускать ее, в этом смысле она не «потоковая».

В любом случае вам необходимо разделить данные перед отправкой в ​​MarkLogic - в идеале куски (документы) <100 МБ (не магическое число, просто хорошая верхняя граница).Таким образом, ваш потоковый код должен читать данные, буферизовать их, разбивать на «куски», а затем отправлять в ML.Однажды в «чанках» будет работать любой API для ML, включая MLCP.Между различными API есть компромиссы между производительностью и удобством использования - я оставлю это для другого обсуждения. </p>

...