Кодировка Derby / JavaDB - размер на диске - PullRequest
0 голосов
/ 03 апреля 2012

Я хочу рассчитать размер, который понадобится моей базе данных JavaDB, и поэтому мне нужно знать, как кодируется char, чтобы знать, сколько байтов он будет использовать на диске.

Кто-нибудь знает, какую кодировку символов использует Derby? Я читал, что Derby использует Unicode, но не смог найти никакой информации о кодировке (ни в справочном руководстве, ни на других страницах).

1 Ответ

0 голосов
/ 04 апреля 2012

Я полагаю, что это UTF8.

Однако всякий раз, когда я пытаюсь выяснить, сколько дискового пространства будет использовать моя база данных, я всегда использую подход сравнения: напишите небольшую тестовую программу, которая генерирует образец базы данных.используя образцы тестовых данных, стараясь сделать эти данные как можно более репрезентативными для вашего приложения.Создайте достаточно данных, чтобы быть реалистичными (например, по крайней мере, 10000 строк).

Создайте некоторое хорошее круглое число строк, например, 10000 или 100000 или 1000000.Затем посмотрите на фактические файлы базы данных, которые Дерби создал на диске, посмотрите, насколько они велики, сделайте небольшое совпадение, и вы сможете выяснить свой результат.

Хорошая вещь в таком подходе заключается в том, чтоэто поможет вам уловить такие ошибки, как: забыть весь вторичный индекс или не понять, что ваше уникальное ограничение добавило кучу накладных расходов, или забыть сосчитать некоторые столбцы, которые, по вашему мнению, не будут иметь значения, но оказалисьзанять значительное количество места.

...