Вы можете использовать:
builder = tfds.builder('mnist')
info = builder.info
print(info)
Вывод:
tfds.core.DatasetInfo(
name='mnist',
version=3.0.1,
description='The MNIST database of handwritten digits.',
homepage='http://yann.lecun.com/exdb/mnist/',
features=FeaturesDict({
'image': Image(shape=(28, 28, 1), dtype=tf.uint8),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
}),
total_num_examples=70000,
splits={
'test': 10000,
'train': 60000,
},
supervised_keys=('image', 'label'),
citation="""@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
volume={2},
year={2010}
}""",
redistribution_info=,
)
Из метаданных информации вы можете извлечь информацию с помощью следующего кода:
info.features
Вывод :
FeaturesDict({
'image': Image(shape=(28, 28, 1), dtype=tf.uint8),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
Количество классов, имена меток:
print(info.features["label"].num_classes)
print(info.features["label"].names)
Вывод:
10
['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
Фигуры, типы данных:
print(info.features.shape)
print(info.features.dtype)
print(info.features['image'].shape)
print(info.features['image'].dtype)
Вывод:
{'image': (28, 28, 1), 'label': ()}
{'image': tf.uint8, 'label': tf.int64}
(28, 28, 1)
<dtype: 'uint8'>
Информация о разделении:
print(info.splits)
Вывод:
{'test': <tfds.core.SplitInfo num_examples=10000>, 'train': <tfds.core.SplitInfo num_examples=60000>}
Доступные разделения:
print(list(info.splits.keys()))
Вывод:
['test', 'train']
И еще несколько. Вы можете увидеть приведенные выше примеры и многое другое на веб-сайте tenorflow @ https://www.tensorflow.org/datasets/overview