работаю над соединителем файлового потока, у меня в файле более десяти миллионов записей (это не один файл, его раздел по учетной записи #). Я должен загрузить эти файлы в topi c и обновить свои потоки. прошел через отдельные потоки, у меня следующий вопрос, и мне нужна помощь для достижения.
- посмотрите на набор данных, у меня есть две учетные записи #, каждая учетная запись имеет 5 строк, мне нужно было бы сгруппировать их в две строки и ввести ключ acctNbr.
как написать исходный соединитель для чтения файла и получения логики группировки c?
мои брокеры работают на Linux машинах X, Y, Z .. после разработки исходного соединителя, мой файл JAR должен быть развернут на каждом брокере (если я начну работать в распределенном брокере)?
У меня есть только 30-минутное окно для извлечения файла в топи c? Какие есть параметры для настройки logi c, чтобы закрыть мое рабочее окно? К вашему сведению, эта топи c будет иметь более 50 разделов и настроено 3 брокера.
Набор данных:
{"acctNbr":"1234567","secNbr":"AAPL","date":"2010-01-01","currentPrice":"10","availQnty":"10"}
{"acctNbr":"1234567","secNbr":"AAPL","date":"2010-01-02","currentPrice":"10","availQnty":"10"}
{"acctNbr":"1234567","secNbr":"AAPL","date":"2010-01-03","currentPrice":"10","availQnty":"10"}
{"acctNbr":"1234567","secNbr":"AAPL","date":"2010-01-04","currentPrice":"10","availQnty":"10"}
{"acctNbr":"1234567","secNbr":"AAPL","date":"2010-01-05","currentPrice":"10","availQnty":"10"}
{"acctNbr":"abc3355","secNbr":"AAPL","date":"2010-01-01","currentPrice":"10","availQnty":"10"}
{"acctNbr":"abc3355","secNbr":"AAPL","date":"2010-01-02","currentPrice":"10","availQnty":"10"}
{"acctNbr":"abc3355","secNbr":"AAPL","date":"2010-01-03","currentPrice":"10","availQnty":"10"}
{"acctNbr":"abc3355","secNbr":"AAPL","date":"2010-01-04","currentPrice":"10","availQnty":"10"}
{"acctNbr":"abc3355","secNbr":"AAPL","date":"2010-01-05","currentPrice":"10","availQnty":"10"}