Search Results for author: Zhilin Yang*

Found 1 papers, 0 papers with code

Transformer-XL: Language Modeling with Longer-Term Dependency

no code implementations • ICLR 2019 • Zihang Dai*, Zhilin Yang*, Yiming Yang, William W. Cohen, Jaime Carbonell, Quoc V. Le, Ruslan Salakhutdinov

Moreover, Transformer-XL is up to 1, 800+ times faster than vanilla Transformer during evaluation.

Language Modelling

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.