Если я правильно вас понимаю, ваши экземпляры состоят из 1024 двоичных значений, которые будут использоваться для классификации данных, и 25 различных возможных классификаций *.
Если вы сохранили свои данные логическим способом,т. е. используя запятую для разделения всех различных значений, вы можете импортировать данные в Excel.Это должно привести к тому, что ваши данные будут разбиты на 1025 различных столбцов, 1024 столбца, содержащих вашу двоичную информацию, и последний 1025-й столбец, содержащий букву.
После этого вы сможете открыть файл CSV в клиенте WEKA GUI илипреобразуйте файл CSV в файл ARFF для дальнейшего использования, в зависимости от того, что вы предпочитаете.
Вышеупомянутые шаги проиллюстрированы ниже на изображениях с использованием некоторых необработанных данных, которые я собрал несколько дней назад (необработанные данные (.txt)-> Обработка данных (CSV) -> Ввод в WEKA (ARFF)):
* Разве это не должно быть 26 для всех букв латинского алфавита?