Question

Итак, я использую шаг ввода текстового файла в Pentaho Data Integration для загрузки строк в мою базу данных.Мне нужно создать уникальный идентификатор для каждой строки, чтобы потом можно было идентифицировать дубликаты в моем преобразовании.Я пытался создать идентификатор, объединяя 3 столбца в один, но некоторые строки всегда будут одинаковыми из-за того, как создается файл.У меня есть «настоящие» дубликаты, так что было трудно заставить их идентифицировать отдельно.Есть ли другой способ идентифицировать каждую строку, чтобы я мог сделать ее своим Первичным ключом и избежать дубликатов?

Спасибо!

ChoCho · Answer 1 · 26 декабря 2018

Если ваша проблема не в уникальных строках, то определите их с помощью Memory Group By, используйте критерии группировки и не указывайте функцию добавления.После распознавания уникальных строк присвойте им последовательность и вуаля!.

Как сгенерировать / создать уникальный идентификатор для строк базы данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как сгенерировать / создать уникальный идентификатор для строк базы данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы