Я хочу создать общий модуль Perl для обработки и анализа наборов данных, разделенных биомедицинскими символами, и который, скорее всего, можно использовать для любых типов наборов данных, которые содержат смесь категорий (A, B, C, ..) и непрерывный (1,2,3,881 ..) и идентификатор (XXX1, XXX2 ...). План состоит в том, чтобы люди инициализировали модуль и затем использовали некоторые аргументы, чтобы указать на файл (ы) данных, место, где должны быть размещены аналитические отчеты, и структуру данных.
Под структурой данных я подразумеваю, какая переменная в каком месте и какое имя / тип. И здесь мне нужно какое-то просветление. Я озадачен, как сделать это чистым способом. Очевидно, что если бы люди создавали простой файл схемы, будь то XML или какой-то другой формат, было бы самым чистым, но, возможно, не всем людям нравится делать что-то подобное.
Решения, которые я могу придумать:
- Создайте файл конфигурации в формате XML или аналогичном и с заданным форматом.
- Передача информации во время инициализации модуля.
- Используйте первую строку данных в качестве заголовков и попытайтесь угадать типы (ой)
Конечно, должен быть "канонический" способ сделать это, который также пригоден для использования и эффективен.