DemoGen | Synthetic Demonstration Generation for Data-Efficient Visuomotor Policy Learning

Visuomotor policies have shown great promise in robotic manipulation but often require substantial amounts of human-collected data for effective performance. A key reason underlying the data demands is their limited spatial generalization capability, which necessitates extensive data collection across different object configurations. In this work, we present DemoGen, a low-cost, fully synthetic approach for automatic demonstration generation. Using only one human-collected demonstration per task, DemoGen generates spatially augmented demonstrations by adapting the demonstrated action trajectory to novel object configurations. Visual observations are synthesized by leveraging 3D point clouds as the modality and rearranging the subjects in the scene via 3D editing. Empirically, DemoGen significantly enhances policy performance across a diverse range of real-world manipulation tasks, showing its applicability even in challenging scenarios involving deformable objects, dexterous hand end-effectors, and bimanual platforms. Furthermore, DemoGen can be extended to enable additional out-of-distribution capabilities, including disturbance resistance and obstacle avoidance.

DemoGen: Synthetic Demonstration Generation
for Data-Efficient Visuomotor Policy Learning

The O.O.D. generalization capabilities of visuomotor policies empowered by DemoGen-generated synthetic demonstrations, given only one human-collected demonstration per task.

Livestreaming: Train Live & Test Live

Abstract

DemoGen Methods

DemoGen for Spatial Generalization

Simulated Experiments

Real-World Protocols

Tasks & Source Demonstrations

Evaluation Videos

Quantitative Results

Time Cost for Generating Real-World Demonstrations

DemoGen for Disturbance Resistance

Augmentation for Disturbance Resistance (ADR)

Evaluation Videos

Quantitative Results

Robustness under Multiple Disturbances

DemoGen for Obstacle Avoidance

Augmentation for Obstacle Avoidance

Evaluation Videos

Empirical Study: Spatial Generalization of Visuomotor Policies

Limitation: The Visual Mismatch Problem

Acknowledgments

BibTeX

DemoGen: Synthetic Demonstration Generation for Data-Efficient Visuomotor Policy Learning

The O.O.D. generalization capabilities of visuomotor policies empowered by DemoGen-generated synthetic demonstrations, given only one human-collected demonstration per task.

Livestreaming: Train Live & Test Live

Abstract

DemoGen Methods

DemoGen for Spatial Generalization

Simulated Experiments

Real-World Protocols

Tasks & Source Demonstrations

Evaluation Videos

Quantitative Results

Time Cost for Generating Real-World Demonstrations

DemoGen for Disturbance Resistance

Augmentation for Disturbance Resistance (ADR)

Evaluation Videos

Quantitative Results

Robustness under Multiple Disturbances

DemoGen for Obstacle Avoidance

Augmentation for Obstacle Avoidance

Evaluation Videos

Empirical Study: Spatial Generalization of Visuomotor Policies

Limitation: The Visual Mismatch Problem

Acknowledgments

BibTeX

DemoGen: Synthetic Demonstration Generation
for Data-Efficient Visuomotor Policy Learning