Question

Я только начал изучать TensorFlow, используя книгу. В книге приведен пример CNN для работы с набором данных MNIST. После обучения я хотел протестировать нейронную сеть сам, не имея возможности видеть только точность теста, но когда я пытаюсь напечатать значение прогноза, он возвращает массив с NaN.

В коде я сделал количество шагов и эпох 1, просто чтобы отладить проблему с NaN (я знаю, что CNN не учится, когда вы делаете это 1).

I уже провел некоторое исследование и нашел следующие вопросы: печать переменной тензорного потока как NaN , ошибка Tensorflow NaN? . Но ответы не решили проблему.

Код ниже - это то, что я запрограммировал, используя книгу с некоторыми небольшими изменениями в коде:

from tensorflow.examples.tutorials.mnist import input_data
import tensorflow.compat.v1 as tf
import numpy as np
import cv2

def weight_variable(shape):
    initial = tf.truncated_normal(shape, stddev=0.1)
    return tf.Variable(initial)

def bias_variable(shape):
    initial = tf.constant(0.1, shape=shape)
    return tf.Variable(initial)

def conv2d(x, W):
    return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')

def max_pool_2x2(x):
    return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

def conv_layer(input, shape):
    W = weight_variable(shape)
    b = weight_variable([shape[3]])
    return tf.nn.relu(conv2d(input, W) + b)

def full_layer(input, size):
    in_size = int(input.get_shape()[1])
    W = weight_variable([in_size, size])
    b = weight_variable([size])
    return tf.matmul(input, W) + b


x = tf.placeholder(tf.float32, shape=[None, 784])
y_ = tf.placeholder(tf.float32, shape=[None, 10])

x_image = tf.reshape(x, shape=[-1, 28, 28, 1])
conv1 = conv_layer(x_image, shape=[5, 5, 1, 32])
conv1_pool = max_pool_2x2(conv1)

conv2 = conv_layer(conv1_pool, shape=[5, 5, 32, 64])
conv2_pool = max_pool_2x2(conv2)

conv2_flat = tf.reshape(conv2_pool, [-1, 7*7*64])
full_1 = tf.nn.relu(full_layer(conv2_flat, 1024))

keep_prob = tf.placeholder(tf.float32)
full1_drop = tf.nn.dropout(full_1, rate=keep_prob)

y_conv = full_layer(full1_drop, 10)


DATA_DIR = '/tmp/data'

mnist = input_data.read_data_sets(DATA_DIR, one_hot=True)

loss = tf.reduce_mean(tf.square((y_-y_conv)))

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(loss)

correct_prediction = tf.equal(tf.argmax(y_conv, 1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

epoch = 1
STEPS = 1
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())

    for _ in range(epoch):
        for i in range(STEPS):
            batch = mnist.train.next_batch(50)

            if i % 100 == 0:
                train_accuracy = sess.run(accuracy, feed_dict={x: batch[0],
                                                               y_: batch[1],
                                                               keep_prob: 1.0})
                print("step: {}, training accuracy: {}%".format(i, train_accuracy*100))

            sess.run(train_step, feed_dict={x: batch[0],
                                            y_: batch[1],
                                            keep_prob: 0.5})

        X = mnist.test.images.reshape(10, 1000, 784)
        Y = mnist.test.labels.reshape(10, 1000, 10)
        test_accuracy = np.mean([sess.run(accuracy,
                                          feed_dict={x: X[i],
                                                     y_: Y[i],
                                                     keep_prob: 1.0})
                                                        for i in range(10)])

        print("test accuracy {}%".format(test_accuracy*100))

    X = mnist.test.images[1].reshape(784)
    Y = mnist.test.labels[1].reshape(10)
    cv2.imshow('', X.reshape((28, 28)))
    cv2.waitKey(1)

    out = sess.run(y_conv, feed_dict={x: [X],
                                        y_: [Y],
                                        keep_prob: 1.0})
    print(out)

Кроме того, когда я заставляю ее тренироваться немного дольше точность колеблется между 9 и 14, но не улучшается.

Python TensorFlow: при получении значения возвращается NaN

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Python TensorFlow: при получении значения возвращается NaN

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы