Per-Decision Option Discounting Anna Harutyunyan, Peter Vrancx, - PowerPoint PPT Presentation

Per-Decision Option Discounting Anna Harutyunyan, Peter Vrancx, Philippe Hamel, Ann Nowe, Doina Precup

Motivation: Agents that reason over long temporal horizons

Motivation: Agents that reason over long temporal horizons Horizon depends on discount γ

Motivation: Agents that reason over long temporal horizons Horizon depends on discount γ Larger grid requires a larger γ

Motivation: Agents that reason over long temporal horizons Horizon depends on discount γ Larger grid requires a larger γ Large γ-s are inefficient in practice :(

Motivation: Agents that reason over long temporal horizons Horizon depends on discount γ Larger grid requires a larger γ Temporal abstraction?

Motivation: Agents that reason over long temporal horizons Horizon depends on discount γ Larger grid requires a larger γ Temporal abstraction? Options still tied to γ!

Motivation: Agents that reason over long temporal horizons Contribution: Generalize the options framework to let it extend the agent’s horizon. Horizon depends on discount γ Larger grid requires a larger γ Temporal abstraction? Options still tied to γ!

The Options Framework Reward model: Transition model:

Options with Time Dilation Reward model: Transition model: (2) per-decision (1) decouple

Options with Time Dilation Reward model: Transition model: (2) per-decision (1) decouple γ p controls how much we care about option duration (pseudo-primitive when γ p =1)

Options with Time Dilation Reward model: Transition model: (2) per-decision (1) decouple γ p controls how much we care about option duration (pseudo-primitive when γ p =1) Key intuition: Insulate option time from global time

Primitive Timestep Invariance Ours Classical

Bias-Variance Tradeoff Empirical error (Four Rooms) Analytical variance bound

Bias-Variance Tradeoff Empirical error (Four Rooms) Analytical variance bound Larger γ p can induce less variance!

Bias-Variance Tradeoff Empirical error (Four Rooms) Analytical variance bound Thanks! More at poster #114 :) Larger γ p can induce less variance!

Per-Decision Option Discounting Anna Harutyunyan, Peter Vrancx, - PowerPoint PPT Presentation

Per-Decision Option Discounting Anna Harutyunyan, Peter Vrancx, Philippe Hamel, Ann Nowe, Doina Precup Motivation: Agents that reason over long temporal horizons Motivation: Agents that reason over long temporal horizons Horizon depends on

& Defense Acquisitions Eric M. Lofgren Technomics, Inc. ICEAA 2015, San Diego 11 June 2015

Discounting Lecture slides Brd Harstad University of Oslo January 2018 Brd Harstad

Discounting Lecture slides Brd Harstad University of Oslo 2019 Brd Harstad (University of

Discounting and Relative Consumption OLOF JOHANSSON-STENMAN AND THOMAS STERNER Motivation The

The economics and ethics of Stern discounting Birmingham University Dr Cameron Hepburn

Uncertainty and Discounting Spring 09 UC Berkeley Traeger 5 Risk and Uncertainty 74

Some Common Confusions about Hyperbolic Discounting 8 February 2008 Eric Rasmusen Abstract

Econom ical Aspects Econom ical Aspects Pay per Risk Pay per Use Pay per Use Pay per

Option A Do Nothing Option Option B Maintain All Schools & Demo Facilities Upgraded

Learning Decision Trees Representation is a decision tree. Bias is towards simple decision

Sudbury Previous Options Option 2 Option 5 Traffic Signals Revised Roundabout Revised

Option 1: Large areas such as gymnasiums, multi-purpose rooms, auditorium Option 2: Rooms such as

Option Greeks 1 Introduction Option Greeks 1 Introduction Set-up Assignment: Read Section

Assessment Option 1: Take-home exam Option 1: Take-home exam Replicate an analysis

6 Decision- -Making Making MVC (revisited) 6 Decision MVC (revisited) decision

DRAFT DRAFT Option Comparison Option Comparison Alignment of Options Alignment of

Wavelet coorbit spaces over general dilation groups Hartmut Fhr fuehr@matha.rwth-aachen.de AHA

Optimistic Regret Minimization for Extensive-Form Games via Dilated Distance-Generating Functions

ANOMALOUS DIFFUSION, DILATION, AND EROSION IN IMAGE PROCESSING joint work with Sophia Vorderw

Jump into ltering IMAGE P ROCES S IN G IN P YTH ON Rebeca Gonzalez Data Engineer Filters

Unitary Dilation of Freely Independent Contractions Scott Atkinson (University of Virginia)

Objectives Review most common pediatric salivary gland disorders Understand role of

Deep learning 10.2. Causal convolutions Fran cois Fleuret https://fleuret.org/ee559/ Nov 1,

Hadamard type operators for real analytic functions of several variables and moments of analytic

Explore More Topics

Sambuz

Useful Links

Newsletter

Mail Us

Per-Decision Option Discounting Anna Harutyunyan, Peter Vrancx, - PowerPoint PPT Presentation

Per-Decision Option Discounting Anna Harutyunyan, Peter Vrancx, Philippe Hamel, Ann Nowe, Doina Precup Motivation: Agents that reason over long temporal horizons Motivation: Agents that reason over long temporal horizons Horizon depends on

&amp; Defense Acquisitions Eric M. Lofgren Technomics, Inc. ICEAA 2015, San Diego 11 June 2015

Discounting Lecture slides Brd Harstad University of Oslo January 2018 Brd Harstad

Discounting Lecture slides Brd Harstad University of Oslo 2019 Brd Harstad (University of

Discounting and Relative Consumption OLOF JOHANSSON-STENMAN AND THOMAS STERNER Motivation The

The economics and ethics of Stern discounting Birmingham University Dr Cameron Hepburn

Uncertainty and Discounting Spring 09 UC Berkeley Traeger 5 Risk and Uncertainty 74

Some Common Confusions about Hyperbolic Discounting 8 February 2008 Eric Rasmusen Abstract

Econom ical Aspects Econom ical Aspects Pay per Risk Pay per Use Pay per Use Pay per

Option A Do Nothing Option Option B Maintain All Schools &amp; Demo Facilities Upgraded

Learning Decision Trees Representation is a decision tree. Bias is towards simple decision

Sudbury Previous Options Option 2 Option 5 Traffic Signals Revised Roundabout Revised

Option 1: Large areas such as gymnasiums, multi-purpose rooms, auditorium Option 2: Rooms such as

Option Greeks 1 Introduction Option Greeks 1 Introduction Set-up Assignment: Read Section

Assessment Option 1: Take-home exam Option 1: Take-home exam Replicate an analysis

6 Decision- -Making Making MVC (revisited) 6 Decision MVC (revisited) decision

DRAFT DRAFT Option Comparison Option Comparison Alignment of Options Alignment of

Wavelet coorbit spaces over general dilation groups Hartmut Fhr fuehr@matha.rwth-aachen.de AHA

Optimistic Regret Minimization for Extensive-Form Games via Dilated Distance-Generating Functions

ANOMALOUS DIFFUSION, DILATION, AND EROSION IN IMAGE PROCESSING joint work with Sophia Vorderw

Jump into ltering IMAGE P ROCES S IN G IN P YTH ON Rebeca Gonzalez Data Engineer Filters

Unitary Dilation of Freely Independent Contractions Scott Atkinson (University of Virginia)

Objectives Review most common pediatric salivary gland disorders Understand role of

Deep learning 10.2. Causal convolutions Fran cois Fleuret https://fleuret.org/ee559/ Nov 1,

Hadamard type operators for real analytic functions of several variables and moments of analytic

Explore More Topics

Sambuz

Useful Links

Newsletter

Mail Us

& Defense Acquisitions Eric M. Lofgren Technomics, Inc. ICEAA 2015, San Diego 11 June 2015

Option A Do Nothing Option Option B Maintain All Schools & Demo Facilities Upgraded