Temporal-Difference Learning

Definition

Temporal-Difference (TD) learning is a model-free reinforcement learning approach that updates value functions based on the difference between successive predictions. It learns directly from experience by bootstrapping, using estimated future values to improve current estimates, enabling online learning without an environment model.

Definition

At a glance

Executive summary

TL;DR

Key points

Use cases

Also known as

Related papers

Related topics