ReePrime
Aprendizaje: El refuerzo

Hosted by Dailymotion. For legal issues report at the Copyright Center, report us on DMC, or use the Instant Removal tool.

Aprendizaje: El refuerzo

R
RAUL ESPERT

74 Views • Mar 03, 2011

Description

El objetivo del aprendizaje por refuerzo es usar el premio-castigo para aprender una función, la cual permitirá tomar decisiones en el futuro de qué acción tomar a partir de una percepción del entorno. La función de agente utiliza la información contenida en él para realizar la toma de decisiones. De ahí el nombre de Aprendizaje por Refuerzo. Existen, no obstante, otros formalismos para aprender, mediante refuerzo, qué acción realizar en cada caso, como por ejemplo las Redes Neuronales. Este método de aprendizaje surge de una rama de estudios de psicología experimental, que pueden remontarse a las experiencias de Pavlov con el refuerzo condicionado, y por otro lado es heredero de los métodos de control óptimo que se originan a partir de los trabajos de Bellman. Dicho de forma breve, el aprendizaje por refuerzo es el problema de conseguir que un agente actúe en un entorno de manera que maximice la recompensa que obtiene por sus acciones.

More from User

07:47

Cerebro: Empatía y neuronas espejo

RAUL ESPERT

01:32

Neurocisticercosis: Larvas de tenia en el cerebro

RAUL ESPERT

16:21

Consecuencias de los TCEs

RAUL ESPERT

12:34

Enfermedad de Creutzfeldt-Jakob (Nueva variante). Mal de las vacas locas

RAUL ESPERT

02:27

Sentidos y cerebro: Percepcion visual

RAUL ESPERT

02:07

Cinetoagnosia: Gisela (2)

RAUL ESPERT

Related Videos

00:10

Read Reinforcement Learning: An Introduction (Adaptive Computation and Machine Learning)# Ebook

Lofis Blok

00:40

Full E-book Tensorflow for Deep Learning: From Linear Regression to Reinforcement Learning Best

dm_3d147d2edfd1a9024c8b13d0cb9ecfaa

00:08

[Download] Reinforcement Learning: An Introduction (Adaptive Computation and Machine Learning)

NieshaEisenba

00:44

[Read] Reinforcement Learning: An Introduction (Adaptive Computation and Machine Learning series)

reocaldwell9

01:27

RL इतनी आसान? 60s में समझो! इस शॉर्ट में मिलेंगे: हुक → विज़ुअल्स → CTA। एक मिनट में Reinforcement Learning (RL) का पूरा खोल — एजेंट, एनवायरनमेंट, एक्शन, रिवॉर्ड और पॉलिसी को तेज़ और क्लियर विज़ुअल्स के साथ समझाया गया। तुरंत समझें Q-learning, Deep RL और क

user1994

03:54

Session 15: Explore Unsupervised Learning & Reinforcement Learning for Network Efficiency in openRAN

Learn And Grow Community