Question

Я попытался загрузить 77 миллионов записей с сервера MSSQL в тему Kafka через JDBC-источник Kafka connect.

Пробный пакетный подход дает batch.max.rows как 1000. В этом случае, после 1000 записей, это во всей памяти.Пожалуйста, поделитесь предложениями о том, как сделать так, чтобы он работал

Ниже описан подход с использованием коннектора, который я пробовал

curl -X POST http://test.com:8083/connectors -H "Content-Type: application/json" -d '{
        "name": "mssql_jdbc_rsitem_pollx",
        "config": {
                "connector.class": "io.confluent.connect.jdbc.JdbcSourceConnector",
                "connection.url": "jdbc:sqlserver://test:1433;databaseName=xxx",
                "connection.user": "xxxx",
                "connection.password": "xxxx",
                "topic.prefix": "mssql-rsitem_pollx-",
                 "mode":"incrementing",
                 "table.whitelist" : "test",
                "timestamp.column.name": "itemid",
         "max.poll.records" :"100",
                "max.poll.interval.ms":"3000",
                "validate.non.null": false
        }
        }'

curl -X POST http://test.com:8083/connectors -H "Content-Type: application/json" -d '{
        "name": "mssql_jdbc_test_polly",
        "config": {
                "connector.class": "io.confluent.connect.jdbc.JdbcSourceConnector",
                "tasks.max": "10",
                "connection.url": "jdbc:sqlserver://test:1433;databaseName=xxx;defaultFetchSize=10000;useCursorFetch=true",
                "connection.user": "xxxx",
                "connection.password": "xxxx",
                "topic.prefix": "mssql-rsitem_polly-",
                 "mode":"incrementing",
                 "table.whitelist" : "test",
                "timestamp.column.name": "itemid",
                "poll.interval.ms":"86400000",
                "validate.non.null": false
        }
        }'

Ali Roaidi · Answer 1 · 08 июля 2019

попробуйте увеличить размер кучи Java, напишите в командной строке:

export KAFKA_HEAP_OPTS="-Xms1g -Xmx2g"

вы можете изменить часть "Xmx2g" в соответствии с вашими возможностями.

Кафка коннект jdbc исходный mssql сервер загрузка миллионов записей выбрасывание из памяти ошибка

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Кафка коннект jdbc исходный mssql сервер загрузка миллионов записей выбрасывание из памяти ошибка

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы