pinocchio: qnet.py File Reference

Variables
float	qnet.DECAY_RATE = 0.99

	qnet.env = DPendulum()
	— Environment More...

	qnet.feed_dict

list	qnet.h_rwd = []
	— History of search More...

float	qnet.LEARNING_RATE = 0.1

int	qnet.NEPISODES = 500
	— Hyper paramaters More...

int	qnet.NSTEPS = 50

	qnet.NU = env.nu

	qnet.NX = env.nx

	qnet.optim

	qnet.Q2 = sess.run(qvalue.qvalue, feed_dict={qvalue.x: onehot(x2)})

	qnet.Qref = sess.run(qvalue.qvalue, feed_dict={qvalue.x: onehot(x)})

	qnet.qvalue = QValueNetwork()

	qnet.RANDOM_SEED = int((time.time() % 10) * 1000)
	— Random seed More...

	qnet.reward

float	qnet.rsum = 0.0

	qnet.sess = tf.InteractiveSession()

	qnet.u = sess.run(qvalue.u, feed_dict={qvalue.x: onehot(x)})[0]

	qnet.x = env.reset()
	— Training More...

	qnet.x2

Classes