Мои необработанные данные представляют собой простые текстовые файлы, где каждая строка представляет собой строку json. Например:
{"f1": "v1", "f2": [1, 2, 3]}
{"f1": "v2", "f2": [2, 3, 4]}
Я прочитал файл в tf.Dataset
с помощью
ds = tf.data.TextLineDataset("file_name"))
Теперь каждый элемент ds
является тензором с dtype=tf.string
.
Как мне разобрать строки json?
Я пытался
ds.map(lambda x: json.loads(x)["f2"])
, но получил
TypeError: the JSON object must be str, bytes or bytearray, not 'Tensor'