ReePrime

Aprendizaje: El refuerzo

Hosted by Dailymotion. For legal issues report at the Copyright Center, report us on DMC, or use the Instant Removal tool.

Aprendizaje: El refuerzo

RAUL ESPERT

74 Views • Mar 03, 2011

Description

El objetivo del aprendizaje por refuerzo es usar el premio-castigo para aprender una función, la cual permitirá tomar decisiones en el futuro de qué acción tomar a partir de una percepción del entorno. La función de agente utiliza la información contenida en él para realizar la toma de decisiones. De ahí el nombre de Aprendizaje por Refuerzo. Existen, no obstante, otros formalismos para aprender, mediante refuerzo, qué acción realizar en cada caso, como por ejemplo las Redes Neuronales. Este método de aprendizaje surge de una rama de estudios de psicología experimental, que pueden remontarse a las experiencias de Pavlov con el refuerzo condicionado, y por otro lado es heredero de los métodos de control óptimo que se originan a partir de los trabajos de Bellman. Dicho de forma breve, el aprendizaje por refuerzo es el problema de conseguir que un agente actúe en un entorno de manera que maximice la recompensa que obtiene por sus acciones.

Keywords & Tags

#learning #reinforcement

More from User

Cerebro: Empatía y neuronas espejo

RAUL ESPERT

Neurocisticercosis: Larvas de tenia en el cerebro

RAUL ESPERT

Consecuencias de los TCEs

RAUL ESPERT

Enfermedad de Creutzfeldt-Jakob (Nueva variante). Mal de las vacas locas

RAUL ESPERT

Sentidos y cerebro: Percepcion visual

RAUL ESPERT

Cinetoagnosia: Gisela (2)

RAUL ESPERT

Related Videos

Read Reinforcement Learning: An Introduction (Adaptive Computation and Machine Learning)# Ebook

Lofis Blok

Full E-book Tensorflow for Deep Learning: From Linear Regression to Reinforcement Learning Best

dm_3d147d2edfd1a9024c8b13d0cb9ecfaa

[Download] Reinforcement Learning: An Introduction (Adaptive Computation and Machine Learning)

NieshaEisenba

[Read] Reinforcement Learning: An Introduction (Adaptive Computation and Machine Learning series)

reocaldwell9

RL इतनी आसान? 60s में समझो! इस शॉर्ट में मिलेंगे: हुक → विज़ुअल्स → CTA। एक मिनट में Reinforcement Learning (RL) का पूरा खोल — एजेंट, एनवायरनमेंट, एक्शन, रिवॉर्ड और पॉलिसी को तेज़ और क्लियर विज़ुअल्स के साथ समझाया गया। तुरंत समझें Q-learning, Deep RL और क

user1994

Session 15: Explore Unsupervised Learning & Reinforcement Learning for Network Efficiency in openRAN

Learn And Grow Community