Local-Canonicalization Equivariant Graph Neural Networks for Sample-Efficient and Generalizable Swarm Robot Control

📅 2025-09-17

📈 Citations: 0

✨ Influential: 0

career value

223K/year

🤖 AI Summary

Multi-agent reinforcement learning (MARL) faces three key challenges in dynamic competitive settings—e.g., pursuit-evasion: training instability, poor adversarial robustness, and limited generalization across varying agent scales. To address these, we propose LEGO, the first MARL framework integrating E(n)-equivariant graph neural networks with role-aware representation learning. LEGO achieves rigid-body transformation equivariance via local coordinate normalization, and jointly incorporates permutation equivariance, heterogeneous feature encoding, and relational modeling—while remaining compatible with mainstream algorithms such as MAPPO. Empirically, LEGO significantly improves policy stability and generalization under unseen swarm sizes, node failures, and adversarial perturbations. It consistently outperforms strong baselines across diverse cooperative and competitive tasks. By enabling scalable, robust, and equivariant multi-agent coordination, LEGO establishes a new paradigm for swarm robotics control via MARL.

Technology Category

Application Category

📝 Abstract

Multi-agent reinforcement learning (MARL) has emerged as a powerful paradigm for coordinating swarms of agents in complex decision-making, yet major challenges remain. In competitive settings such as pursuer-evader tasks, simultaneous adaptation can destabilize training; non-kinetic countermeasures often fail under adverse conditions; and policies trained in one configuration rarely generalize to environments with a different number of agents. To address these issues, we propose the Local-Canonicalization Equivariant Graph Neural Networks (LEGO) framework, which integrates seamlessly with popular MARL algorithms such as MAPPO. LEGO employs graph neural networks to capture permutation equivariance and generalization to different agent numbers, canonicalization to enforce E(n)-equivariance, and heterogeneous representations to encode role-specific inductive biases. Experiments on cooperative and competitive swarm benchmarks show that LEGO outperforms strong baselines and improves generalization. In real-world experiments, LEGO demonstrates robustness to varying team sizes and agent failure.

Problem

Research questions and friction points this paper is trying to address.

Addresses sample inefficiency in multi-agent reinforcement learning

Improves generalization to varying numbers of swarm robots

Enhances robustness in competitive multi-agent environments

Innovation

Methods, ideas, or system contributions that make the work stand out.

Graph neural networks for permutation equivariance

Canonicalization enforcing E(n)-equivariance

Heterogeneous representations encoding role-specific biases

🔎 Similar Papers

LPAC: Learnable Perception-Action-Communication Loops with Applications to Coverage Control