toward object-oriented deep reinforcement...

41

Matthew Botvinick DeepMind, London UK Gatsby Computational Neuroscience Unit, UCL Toward object-oriented deep reinforcement learning

Upload: others

Post on 08-May-2020

6 views

Category:

Documents

0 download

Report

Download

Embed Size (px):

TRANSCRIPT

Page 1: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

Matthew BotvinickDeepMind, London UKGatsby Computational Neuroscience Unit, UCL

Toward object-oriented deep reinforcement learning

Page 2: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

atari

Mnih et al, Nature (2015)

Page 3: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Jaderberg et al., Science, 2019

Page 4: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

dqn convnet

Mnih et al, Nature (2015)

Page 5: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1lake

Page 6: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Page 7: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1objects — pic

Page 8: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1human objects

Kahneman et al., 1992

Page 9: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Egly, Driver, and Rafal (1994); Moore, Yantis, and Vaughan (1998)

Automatic spread of attention

Page 10: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Roelfsema et al. Nature, 1998

Page 11: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

LO??? (Kanwisher)

Malach et al., PNAS, 1995

Page 12: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

objects — pic AGAIN

Page 13: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1diuk (cf?)

cf. Keramati et al., 2018; Cobo et al., 2013; Garnelo et al., 2016; Lazaro-Gradillo et al., 2019; Zambaldi, et al., 2018

Page 14: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

Page 15: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Page 16: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

E.g., Girshick, 2015; He et al., 2017; Redmon & Farhadi, 2018

Page 17: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Page 18: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

Alex Lerchner Chris Burgess Loic Matthey Klaus Greff

Nick Watters Irina Higgins Rishabh Kabra Malcolm Reynolds

Page 19: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

Page 20: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

Page 21: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

half refrigerator

Page 22: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

other half refrigerator

Page 23: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

objects — pic AGAIN

Page 24: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

Page 25: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

Page 26: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

Page 27: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

Page 28: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

Page 29: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

Page 30: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

Page 31: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Page 32: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Page 33: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Page 34: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Kahneman & Treisman, 1984: Object Files

Green, Edwin James, and Jake Quilty-Dunn. "what is an object file?." The British Journal for the Philosophy of Science (2017).

Page 35: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Page 36: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Page 37: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Page 38: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Page 39: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Page 40: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

+1

+1

Page 41: Toward object-oriented deep reinforcement learningalgonauts.csail.mit.edu/slides/Algonauts2019_Matt_Botvinick.pdfon episodic memory and meta- learning. Alongside their interest as

Alex Lerchner Chris Burgess Loic Matthey Klaus Greff

Nick Watters Irina Higgins Rishabh Kabra Malcolm Reynolds

Abstractuse end-to-end reinforcement or imitation learning with recurrent neural networks to build episodic memory and learn semantic priors implicitly [30, 16, 49, 31]. However, end-to-end

Soar Workshop Episodic Memory Tutorial

Episodic Multi-agent Reinforcement Learning with Curiosity

Sample-Efficient Deep Reinforcement Learning via Episodic ... · Learning Environment, Deep Q-Network (DQN) [14] requires 200 million frames of experience for training which corresponds

Continuities and discontinuities between imagination and ...andre-santanna.com/papers/chb-imagination-final.pdf · between episodic memory and episodic imagination. Episodic memory

Gender differences in episodic memory - Springervantage in episodic memory remain to be addressed. First, additional evidence regarding gender differences in episodic memory is needed

Aphantasia, SDAM, and Episodic Memory

Introduction to Cognitive RoboticsTypes of Memory Episodic •Episodic memory is a constructive process –Each time an event is assimilated into episodic memory, past episodes are

Understanding Ungulate Herbivory-Episodic Disturbance

Age-related Differences in Episodic Memory Retrieval ERP ... · episodic and semantic elements (Moscovitch et al., 2005). 1.2 Neurocognitive models of episodic memory retrieval Of

Tulving episodic semantic

Episodic volunteering - A rapid literature review...5 | Episodic volunteering – A rapid literature review Key points • Episodic volunteers prefer short-term, time-limited or irregular

Decision making in episodic environments

Episodic Reinforcement Learning Control Approach for Biped ... · reinforcement learning (RL) could be applied for the control of humanoid robots, based on the experience gained in

Emotional Processing and Episodic Memory

Model-Free Episodic Control

Primary Episodic Ataxias

Policy Improvement: Between Black-Box Optimization and Episodic Reinforcement Learning

Deep Episodic Value Iteration for Model-based Meta ... · 1 Introduction The deep reinforcement learning paradigm popularized by [1] has been uniquely capable of obtaining good asymptotic

Flick- The Episodic Interview

Episodic Specialization of Classification Rules

COMPARISON OF EPISODIC AND NON-EPISODIC NON-VOLCANIC …summit.sfu.ca/system/files/iritems1/2280/etd2098.pdf · 2020-05-07 · COMPARISON OF EPISODIC AND NON-EPISODIC NON-VOLCANIC

Efficiently Implementing Episodic Memory

Episodic memory: a comparative approach

Episodic Bouts of Activity

DyBaNeM: Bayesian Model of Episodic Memory · 2020. 10. 9. · episodic memory modeling called DyBaNeM. DyBaNeM connects episodic mem-ory abilities and activity recognition algorithms

Long-Term Memory: Episodic

Assessment of Eutrophication in Estuaries and Coastal Waters Eutrophication.pdf · Periodic Periodic Periodic Periodic Episodic Episodic Episodic Unknown Any Frequency High High Moderate

EPISODIC MEMORY: WHY AND HOW?

Imagining the personal past: Episodic counterfactuals compared to episodic …€¦ · · 2017-08-26Imagining the personal past: Episodic counterfactuals compared ... generated

Episodic future thinking and episodic counterfactual

Computational Models of Episodic Memory

Episodic Memory in Lifelong Language Learningpapers.nips.cc/paper/9471-episodic-memory-in-lifelong...Episodic Memory in Lifelong Language Learning Cyprien de Masson d’Autume, Sebastian

Extended Episodic Experience 2011

Reinforcement Learning and Episodic Memory in …ndaw/gd17.pdf · PS68CH05-Gershman ARI 4 November 2016 10:31 Reinforcement Learning and Episodic Memory in Humans and Animals: An