TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
SMAC	SMAC 27m_vs_30m	Heuristic	Median Win Rate	0	# 11
SMAC	SMAC 27m_vs_30m	QMIX	Median Win Rate	49	# 7
SMAC	SMAC 3s5z_vs_3s6z	IQL	Median Win Rate	0	# 12
SMAC	SMAC 3s5z_vs_3s6z	Heuristic	Median Win Rate	0	# 12
SMAC	SMAC 3s5z_vs_3s6z	VDN	Median Win Rate	2	# 10
SMAC	SMAC 6h_vs_8z	QMIX	Median Win Rate	3	# 6
SMAC	SMAC 6h_vs_8z	Heuristic	Median Win Rate	0	# 8
SMAC	SMAC 6h_vs_8z	VDN	Median Win Rate	0	# 8
SMAC	SMAC 6h_vs_8z	IQL	Median Win Rate	0	# 8
SMAC	SMAC corridor	QMIX	Median Win Rate	1	# 10
SMAC	SMAC corridor	IQL	Median Win Rate	0	# 12
SMAC	SMAC corridor	Heuristic	Median Win Rate	0	# 12
SMAC	SMAC MMM2	Heuristic	Median Win Rate	0	# 13
SMAC	SMAC MMM2	VDN	Median Win Rate	1	# 12
SMAC	SMAC MMM2	IQL	Median Win Rate	0	# 13
SMAC	SMAC MMM2	QMIX	Median Win Rate	69	# 9

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/the-starcraft-multi-agent-challenge/smac-on-smac-6h-vs-8z-1)](https://paperswithcode.com/sota/smac-on-smac-6h-vs-8z-1?p=the-starcraft-multi-agent-challenge)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/the-starcraft-multi-agent-challenge/smac-on-smac-27m-vs-30m)](https://paperswithcode.com/sota/smac-on-smac-27m-vs-30m?p=the-starcraft-multi-agent-challenge)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/the-starcraft-multi-agent-challenge/smac-on-smac-mmm2-1)](https://paperswithcode.com/sota/smac-on-smac-mmm2-1?p=the-starcraft-multi-agent-challenge)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/the-starcraft-multi-agent-challenge/smac-on-smac-3s5z-vs-3s6z-1)](https://paperswithcode.com/sota/smac-on-smac-3s5z-vs-3s6z-1?p=the-starcraft-multi-agent-challenge)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/the-starcraft-multi-agent-challenge/smac-on-smac-corridor)](https://paperswithcode.com/sota/smac-on-smac-corridor?p=the-starcraft-multi-agent-challenge)`

The StarCraft Multi-Agent Challenge

11 Feb 2019 · Mikayel Samvelyan, Tabish Rashid, Christian Schroeder de Witt, Gregory Farquhar, Nantas Nardelli, Tim G. J. Rudner, Chia-Man Hung, Philip H. S. Torr, Jakob Foerster, Shimon Whiteson ·

In the last few years, deep multi-agent reinforcement learning (RL) has become a highly active area of research. A particularly challenging class of problems in this area is partially observable, cooperative, multi-agent learning, in which teams of agents must learn to coordinate their behaviour while conditioning only on their private observations. This is an attractive research area since such problems are relevant to a large number of real-world systems and are also more amenable to evaluation than general-sum problems. Standardised environments such as the ALE and MuJoCo have allowed single-agent RL to move beyond toy domains, such as grid worlds. However, there is no comparable benchmark for cooperative multi-agent RL. As a result, most papers in this field use one-off toy problems, making it difficult to measure real progress. In this paper, we propose the StarCraft Multi-Agent Challenge (SMAC) as a benchmark problem to fill this gap. SMAC is based on the popular real-time strategy game StarCraft II and focuses on micromanagement challenges where each unit is controlled by an independent agent that must act based on local observations. We offer a diverse set of challenge maps and recommendations for best practices in benchmarking and evaluations. We also open-source a deep multi-agent RL learning framework including state-of-the-art algorithms. We believe that SMAC can provide a standard benchmark environment for years to come. Videos of our best agents for several SMAC scenarios are available at: https://youtu.be/VZ7zmQ_obZ0.

PDF Abstract

Code

Add Remove Mark official

oxwhirl/pymarl official

1,716

oxwhirl/smac official

997

starry-sky6688/marl-algorithms

1,305

Denys88/rl_games

↳ Quickstart in

Colab

708

uoe-agents/epymarl

401

See all 20 implementations

Tasks

Add Remove

Benchmarking

Multi-agent Reinforcement Learning

Real-Time Strategy Games

Reinforcement Learning (RL)

SMAC

SMAC+

Starcraft

Starcraft II

Datasets

Introduced in the Paper:

SMAC

Results from the Paper

Edit

Ranked #6 on SMAC on SMAC 6h_vs_8z

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
SMAC	SMAC 27m_vs_30m	Heuristic	Median Win Rate	0	# 11	Compare
SMAC	SMAC 27m_vs_30m	QMIX	Median Win Rate	49	# 7	Compare
SMAC	SMAC 3s5z_vs_3s6z	IQL	Median Win Rate	0	# 12	Compare
SMAC	SMAC 3s5z_vs_3s6z	Heuristic	Median Win Rate	0	# 12	Compare
SMAC	SMAC 3s5z_vs_3s6z	VDN	Median Win Rate	2	# 10	Compare
SMAC	SMAC 6h_vs_8z	QMIX	Median Win Rate	3	# 6	Compare
SMAC	SMAC 6h_vs_8z	Heuristic	Median Win Rate	0	# 8	Compare
SMAC	SMAC 6h_vs_8z	VDN	Median Win Rate	0	# 8	Compare
SMAC	SMAC 6h_vs_8z	IQL	Median Win Rate	0	# 8	Compare
SMAC	SMAC corridor	QMIX	Median Win Rate	1	# 10	Compare
SMAC	SMAC corridor	IQL	Median Win Rate	0	# 12	Compare
SMAC	SMAC corridor	Heuristic	Median Win Rate	0	# 12	Compare
SMAC	SMAC MMM2	Heuristic	Median Win Rate	0	# 13	Compare
SMAC	SMAC MMM2	VDN	Median Win Rate	1	# 12	Compare
SMAC	SMAC MMM2	IQL	Median Win Rate	0	# 13	Compare
SMAC	SMAC MMM2	QMIX	Median Win Rate	69	# 9	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

The StarCraft Multi-Agent Challenge

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove