#include <rl_common/Random.h>
#include <rl_common/core.hh>
#include <rl_common/ExperienceFile.hh>
#include "../Models/FactoredModel.hh"
#include "../Models/C45Tree.hh"
#include <set>
#include <vector>
#include <map>
#include <sstream>
#include <deque>

Include dependency graph for ParallelETUCT.hh:

This graph shows which files directly or indirectly include this file:

Go to the source code of this file.

Classes
class	ParallelETUCT
struct	ParallelETUCT::state_info
struct	ParallelETUCT::state_samples
Functions
void *	parallelModelLearningStart (void *arg)
void *	parallelSearchStart (void *arg)

Detailed Description

Defines my real-time model-based RL architecture which uses UCT with eligiblity traces for planning. The modified version of UCT used is presented in: L. Kocsis and C. Szepesv´ari, "Bandit based monte-carlo planning," in ECML-06. Number 4212 in LNCS. Springer, 2006, pp. 282-293. The real-time architecture is presented in: Hester, Quinlan, and Stone, "A Real-Time Model-Based Reinforcement Learning Architecture for Robot Control", arXiv 1105.1749, 2011.

Author:: Todd Hester

Definition in file ParallelETUCT.hh.

Function Documentation

void* parallelModelLearningStart ( void * arg )

Thread that loops, continually updating model with new experiences.

Definition at line 514 of file ParallelETUCT.cc.

void* parallelSearchStart ( void * arg )

Parallel thread that continually does uct search from agent's current state.

Definition at line 1132 of file ParallelETUCT.cc.

Classes

Functions

Detailed Description

Function Documentation