imitation.scripts.train_imitation#

Trains DAgger on synthetic demonstrations generated from an expert policy.

Functions

`bc`(bc, _run, _rnd)	Runs BC training.
`dagger`(bc, dagger, _run, _rnd)	Runs DAgger training.
`main_console`()
`sqil`(sqil, policy, rl, _run, _rnd)	rtype `Mapping`[`str`, `Mapping`[`str`, `float`]]

imitation.scripts.train_imitation.bc(bc, _run, _rnd)[source]#

Runs BC training.

Parameters

Return type

Mapping[str, Mapping[str, float]]

Returns

Statistics for rollouts from the trained policy and demonstration data.

imitation.scripts.train_imitation.dagger(bc, dagger, _run, _rnd)[source]#

Runs DAgger training.

Parameters

Return type

Mapping[str, Mapping[str, float]]

Returns

Statistics for rollouts from the trained policy and demonstration data.

imitation.scripts.train_imitation.sqil(sqil, policy, rl, _run, _rnd)[source]#