Orchard (A Benchmark For Measuring Systematic Generalization of Multi-Hierarchical Reasoning)

Introduced by Pung et al. in ORCHARD: A Benchmark For Measuring Systematic Generalization of Multi-Hierarchical Reasoning

Orchard is a diagnostic dataset for systematically evaluating hierarchical reasoning in state-of-the-art neural sequence models

Homepage

No benchmarks yet. Start a new benchmark or link an existing one.

Paper	Code	Results	Date	Stars

No data loaders found. You can submit your data loader here.

ListOps