|
||||||||||
PREV CLASS NEXT CLASS | FRAMES NO FRAMES | |||||||||
SUMMARY: NESTED | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD |
java.lang.Objectmarkov.ValueIteration
public class ValueIteration
implante une politique basee sur un mdp avec recompense inclus value iteration, permettant l'estimation d'une politique optimale
Constructor Summary | |
---|---|
ValueIteration(IRecompense recompense,
IFournisseur modele)
Initialise l'algorithme avec un modèle et une récompense. |
Method Summary | |
---|---|
IAction |
actionOptimale(int etat)
Donne l'action optimale à effectuer. |
void |
afficherValeurs()
Affiche la matrice des QValues. |
void |
computeValueIteration(int horizon,
double gam)
Calcul de la politique de proche en proche. |
IAction[] |
getPolitique()
Renvoie la politique calculée. |
double[][] |
getQValue()
Renvoie un tableau[etat][action] de valeurs. |
double[] |
getQValue(int etat)
Renvoie un tableau[action] de valeurs attendues pour chaque action effectuée dans etat . |
double |
getQValue(int etat,
int action)
Renvoie un la valeur attendue de action effectuée dans etat . |
void |
oneStep(double decroissance)
Effectue un pas de calcul. |
void |
resetValeurs()
Remet l'ensemble des calculs à zéro. |
Methods inherited from class java.lang.Object |
---|
equals, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait |
Constructor Detail |
---|
public ValueIteration(IRecompense recompense, IFournisseur modele)
recompense
- la récompense fournie au système.modele
- le modèle markovien.Method Detail |
---|
public IAction[] getPolitique()
IAction
.public double[][] getQValue()
public double[] getQValue(int etat)
etat
.
etat
- l'état dans lequel se fait l'action.
public double getQValue(int etat, int action)
action
effectuée dans etat
.
etat
- l'état dans lequel se fait l'action.action
- le numéro de l'action à faire.
public IAction actionOptimale(int etat)
etat
- le numéro de l'é interrogé.
etat
.public void resetValeurs()
public void computeValueIteration(int horizon, double gam)
horizon
- le nombre de pas de calcul à effectuer.gam
- le facteur de remise (discount-factor).public void oneStep(double decroissance)
decroissance
- le facteur de remise (discount-factor).public void afficherValeurs()
|
||||||||||
PREV CLASS NEXT CLASS | FRAMES NO FRAMES | |||||||||
SUMMARY: NESTED | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD |