Search Results for author: Julia Kreutzer

Found 37 papers, 18 papers with code

Bandits Don’t Follow Rules: Balancing Multi-Facet Machine Translation with Multi-Armed Bandits

no code implementations • Findings (EMNLP) 2021 • Julia Kreutzer, David Vilar, Artem Sokolov

Training data for machine translation (MT) is often sourced from a multitude of large corpora that are multi-faceted in nature, e. g. containing contents from multiple domains or different levels of quality or complexity.

Machine Translation Multi-Armed Bandits +1

Paper
Add Code

Back to Basics: Revisiting REINFORCE Style Optimization for Learning from Human Feedback in LLMs

no code implementations • 22 Feb 2024 • Arash Ahmadian, Chris Cremer, Matthias Gallé, Marzieh Fadaee, Julia Kreutzer, Olivier Pietquin, Ahmet Üstün, Sara Hooker

AI alignment in the shape of Reinforcement Learning from Human Feedback (RLHF) is increasingly treated as a crucial ingredient for high performance large language models.

Paper
Add Code

Aya Model: An Instruction Finetuned Open-Access Multilingual Language Model

no code implementations • 12 Feb 2024 • Ahmet Üstün, Viraat Aryabumi, Zheng-Xin Yong, Wei-Yin Ko, Daniel D'souza, Gbemileke Onilude, Neel Bhandari, Shivalika Singh, Hui-Lee Ooi, Amr Kayid, Freddie Vargus, Phil Blunsom, Shayne Longpre, Niklas Muennighoff, Marzieh Fadaee, Julia Kreutzer, Sara Hooker

Recent breakthroughs in large language models (LLMs) have centered around a handful of data-rich languages.

Language Modelling

Paper
Add Code

Aya Dataset: An Open-Access Collection for Multilingual Instruction Tuning

no code implementations • 9 Feb 2024 • Shivalika Singh, Freddie Vargus, Daniel Dsouza, Börje F. Karlsson, Abinaya Mahendiran, Wei-Yin Ko, Herumb Shandilya, Jay Patel, Deividas Mataciunas, Laura OMahony, Mike Zhang, Ramith Hettiarachchi, Joseph Wilson, Marina Machado, Luisa Souza Moura, Dominik Krzemiński, Hakimeh Fadaei, Irem Ergün, Ifeoma Okoh, Aisha Alaagib, Oshan Mudannayake, Zaid Alyafeai, Vu Minh Chien, Sebastian Ruder, Surya Guthikonda, Emad A. Alghamdi, Sebastian Gehrmann, Niklas Muennighoff, Max Bartolo, Julia Kreutzer, Ahmet Üstün, Marzieh Fadaee, Sara Hooker

The Aya initiative also serves as a valuable case study in participatory research, involving collaborators from 119 countries.

Instruction Following Language Modelling +1

Paper
Add Code

Intriguing Properties of Compression on Multilingual Models

no code implementations • 4 Nov 2022 • Kelechi Ogueji, Orevaoghene Ahia, Gbemileke Onilude, Sebastian Gehrmann, Sara Hooker, Julia Kreutzer

Multilingual models are often particularly dependent on scaling to generalize to a growing number of languages.

named-entity-recognition Named Entity Recognition +1

Paper
Add Code

JoeyS2T: Minimalistic Speech-to-Text Modeling with JoeyNMT

2 code implementations • 5 Oct 2022 • Mayumi Ohta, Julia Kreutzer, Stefan Riezler

JoeyS2T is a JoeyNMT extension for speech-to-text tasks such as automatic speech recognition and end-to-end speech translation.

Automatic Speech Recognition Automatic Speech Recognition (ASR) +4

656

Paper
Code

Building Machine Translation Systems for the Next Thousand Languages

no code implementations • 9 May 2022 • Ankur Bapna, Isaac Caswell, Julia Kreutzer, Orhan Firat, Daan van Esch, Aditya Siddhant, Mengmeng Niu, Pallavi Baljekar, Xavier Garcia, Wolfgang Macherey, Theresa Breiner, Vera Axelrod, Jason Riesa, Yuan Cao, Mia Xu Chen, Klaus Macherey, Maxim Krikun, Pidong Wang, Alexander Gutkin, Apurva Shah, Yanping Huang, Zhifeng Chen, Yonghui Wu, Macduff Hughes

In this paper we share findings from our effort to build practical machine translation (MT) systems capable of translating across over one thousand languages.

Language Identification Machine Translation +1

Paper
Add Code

A Few Thousand Translations Go a Long Way! Leveraging Pre-trained Models for African News Translation

1 code implementation • NAACL 2022 • David Ifeoluwa Adelani, Jesujoba Oluwadara Alabi, Angela Fan, Julia Kreutzer, Xiaoyu Shen, Machel Reid, Dana Ruiter, Dietrich Klakow, Peter Nabende, Ernie Chang, Tajuddeen Gwadabe, Freshia Sackey, Bonaventure F. P. Dossou, Chris Chinenye Emezue, Colin Leong, Michael Beukman, Shamsuddeen Hassan Muhammad, Guyo Dub Jarso, Oreen Yousuf, Andre Niyongabo Rubungo, Gilles Hacheme, Eric Peter Wairagala, Muhammad Umair Nasir, Benjamin Ayoade Ajibade, Tunde Oluwaseyi Ajayi, Yvonne Wambui Gitau, Jade Abbott, Mohamed Ahmed, Millicent Ochieng, Anuoluwapo Aremu, Perez Ogayo, Jonathan Mukiibi, Fatoumata Ouoba Kabore, Godson Koffi Kalipe, Derguene Mbaye, Allahsera Auguste Tapo, Victoire Memdjokam Koagne, Edwin Munkoh-Buabeng, Valencia Wagner, Idris Abdulmumin, Ayodele Awokoya, Happy Buzaaba, Blessing Sibanda, Andiswa Bukula, Sam Manthalu

We focus on two questions: 1) How can pre-trained models be used for languages not included in the initial pre-training?

Translation

Paper
Code

Can Multilinguality benefit Non-autoregressive Machine Translation?

no code implementations • 16 Dec 2021 • Sweta Agrawal, Julia Kreutzer, Colin Cherry

Non-autoregressive (NAR) machine translation has recently achieved significant improvements, and now outperforms autoregressive (AR) models on some benchmarks, providing an efficient alternative to AR inference.

Machine Translation Translation

Paper
Add Code

Bandits Don't Follow Rules: Balancing Multi-Facet Machine Translation with Multi-Armed Bandits

no code implementations • 13 Oct 2021 • Julia Kreutzer, David Vilar, Artem Sokolov

Machine Translation Multi-Armed Bandits +1

Paper
Add Code

The Low-Resource Double Bind: An Empirical Study of Pruning for Low-Resource Machine Translation

1 code implementation • Findings (EMNLP) 2021 • Orevaoghene Ahia, Julia Kreutzer, Sara Hooker

However, evaluation of the trade-offs incurred by popular compression techniques has been centered on high-resource datasets.

Machine Translation Memorization +1

Paper
Code

Evaluating Multiway Multilingual NMT in the Turkic Languages

1 code implementation • WMT (EMNLP) 2021 • Jamshidbek Mirzakhalov, Anoop Babu, Aigiz Kunafin, Ahsan Wahab, Behzod Moydinboyev, Sardana Ivanova, Mokhiyakhon Uzokova, Shaxnoza Pulatova, Duygu Ataman, Julia Kreutzer, Francis Tyers, Orhan Firat, John Licato, Sriram Chellappan

Then, we train 26 bilingual baselines as well as a multi-way neural MT (MNMT) model using the corpus and perform an extensive analysis using automatic metrics as well as human evaluations.

Machine Translation NMT

Paper
Code

Modelling Latent Translations for Cross-Lingual Transfer

1 code implementation • 23 Jul 2021 • Edoardo Maria Ponti, Julia Kreutzer, Ivan Vulić, Siva Reddy

To remedy this, we propose a new technique that integrates both steps of the traditional pipeline (translation and classification) into a single model, by treating the intermediate translations as a latent random variable.

Cross-Lingual Transfer Few-Shot Learning +5

Paper
Code

Revisiting the Weaknesses of Reinforcement Learning for Neural Machine Translation

1 code implementation • NAACL 2021 • Samuel Kiegeland, Julia Kreutzer

Policy gradient algorithms have found wide adoption in NLP, but have recently become subject to criticism, doubting their suitability for NMT.

Domain Adaptation Machine Translation +4

Paper
Code

MasakhaNER: Named Entity Recognition for African Languages

2 code implementations • 22 Mar 2021 • David Ifeoluwa Adelani, Jade Abbott, Graham Neubig, Daniel D'souza, Julia Kreutzer, Constantine Lignos, Chester Palen-Michel, Happy Buzaaba, Shruti Rijhwani, Sebastian Ruder, Stephen Mayhew, Israel Abebe Azime, Shamsuddeen Muhammad, Chris Chinenye Emezue, Joyce Nakatumba-Nabende, Perez Ogayo, Anuoluwapo Aremu, Catherine Gitau, Derguene Mbaye, Jesujoba Alabi, Seid Muhie Yimam, Tajuddeen Gwadabe, Ignatius Ezeani, Rubungo Andre Niyongabo, Jonathan Mukiibi, Verrah Otiende, Iroro Orife, Davis David, Samba Ngom, Tosin Adewumi, Paul Rayson, Mofetoluwa Adeyemi, Gerald Muriuki, Emmanuel Anebi, Chiamaka Chukwuneke, Nkiruka Odu, Eric Peter Wairagala, Samuel Oyerinde, Clemencia Siro, Tobius Saul Bateesa, Temilola Oloyede, Yvonne Wambui, Victor Akinode, Deborah Nabagereka, Maurice Katusiime, Ayodele Awokoya, Mouhamadane MBOUP, Dibora Gebreyohannes, Henok Tilaye, Kelechi Nwaike, Degaga Wolde, Abdoulaye Faye, Blessing Sibanda, Orevaoghene Ahia, Bonaventure F. P. Dossou, Kelechi Ogueji, Thierno Ibrahima DIOP, Abdoulaye Diallo, Adewale Akinfaderin, Tendai Marengereke, Salomey Osei

We take a step towards addressing the under-representation of the African continent in NLP research by creating the first large publicly available high-quality dataset for named entity recognition (NER) in ten African languages, bringing together a variety of stakeholders.

named-entity-recognition Named Entity Recognition +2

Paper
Code

Quality at a Glance: An Audit of Web-Crawled Multilingual Datasets

no code implementations • 22 Mar 2021 • Julia Kreutzer, Isaac Caswell, Lisa Wang, Ahsan Wahab, Daan van Esch, Nasanbayar Ulzii-Orshikh, Allahsera Tapo, Nishant Subramani, Artem Sokolov, Claytone Sikasote, Monang Setyawan, Supheakmungkol Sarin, Sokhar Samb, Benoît Sagot, Clara Rivera, Annette Rios, Isabel Papadimitriou, Salomey Osei, Pedro Ortiz Suarez, Iroro Orife, Kelechi Ogueji, Andre Niyongabo Rubungo, Toan Q. Nguyen, Mathias Müller, André Müller, Shamsuddeen Hassan Muhammad, Nanda Muhammad, Ayanda Mnyakeni, Jamshidbek Mirzakhalov, Tapiwanashe Matangira, Colin Leong, Nze Lawson, Sneha Kudugunta, Yacine Jernite, Mathias Jenny, Orhan Firat, Bonaventure F. P. Dossou, Sakhile Dlamini, Nisansa de Silva, Sakine Çabuk Ballı, Stella Biderman, Alessia Battisti, Ahmed Baruwa, Ankur Bapna, Pallavi Baljekar, Israel Abebe Azime, Ayodele Awokoya, Duygu Ataman, Orevaoghene Ahia, Oghenefego Ahia, Sweta Agrawal, Mofetoluwa Adeyemi

With the success of large-scale pre-training and multilingual modeling in Natural Language Processing (NLP), recent years have seen a proliferation of large, web-mined text datasets covering hundreds of languages.

Paper
Add Code

Neural Machine Translation for Extremely Low-Resource African Languages: A Case Study on Bambara

no code implementations • loresmt (AACL) 2020 • Allahsera Auguste Tapo, Bakary Coulibaly, Sébastien Diarra, Christopher Homan, Julia Kreutzer, Sarah Luger, Arthur Nagashima, Marcos Zampieri, Michael Leventhal

Low-resource languages present unique challenges to (neural) machine translation.

Machine Translation Translation

Paper
Add Code

Offline Reinforcement Learning from Human Feedback in Real-World Sequence-to-Sequence Tasks

no code implementations • ACL (spnlp) 2021 • Julia Kreutzer, Stefan Riezler, Carolin Lawrence

Large volumes of interaction logs can be collected from NLP systems that are deployed in the real world.

reinforcement-learning Reinforcement Learning (RL)

Paper
Add Code

KINNEWS and KIRNEWS: Benchmarking Cross-Lingual Text Classification for Kinyarwanda and Kirundi

1 code implementation • COLING 2020 • Rubungo Andre Niyongabo, Hong Qu, Julia Kreutzer, Li Huang

Recent progress in text classification has been focused on high-resource languages such as English and Chinese.

Benchmarking Cross-Lingual Transfer +9

Paper
Code

Inference Strategies for Machine Translation with Conditional Masking

no code implementations • EMNLP 2020 • Julia Kreutzer, George Foster, Colin Cherry

Conditional masked language model (CMLM) training has proven successful for non-autoregressive and semi-autoregressive sequence generation tasks, such as machine translation.

Language Modelling Machine Translation +1

Paper
Add Code

Participatory Research for Low-resourced Machine Translation: A Case Study in African Languages

4 code implementations • Findings of the Association for Computational Linguistics 2020 • Wilhelmina Nekoto, Vukosi Marivate, Tshinondiwa Matsila, Timi Fasubaa, Tajudeen Kolawole, Taiwo Fagbohungbe, Solomon Oluwole Akinola, Shamsuddeen Hassan Muhammad, Salomon Kabongo, Salomey Osei, Sackey Freshia, Rubungo Andre Niyongabo, Ricky Macharm, Perez Ogayo, Orevaoghene Ahia, Musie Meressa, Mofe Adeyemi, Masabata Mokgesi-Selinga, Lawrence Okegbemi, Laura Jane Martinus, Kolawole Tajudeen, Kevin Degila, Kelechi Ogueji, Kathleen Siminyu, Julia Kreutzer, Jason Webster, Jamiil Toure Ali, Jade Abbott, Iroro Orife, Ignatius Ezeani, Idris Abdulkabir Dangana, Herman Kamper, Hady Elsahar, Goodness Duru, Ghollah Kioko, Espoir Murhabazi, Elan van Biljon, Daniel Whitenack, Christopher Onyefuluchi, Chris Emezue, Bonaventure Dossou, Blessing Sibanda, Blessing Itoro Bassey, Ayodele Olabiyi, Arshath Ramkilowan, Alp Öktem, Adewale Akinfaderin, Abdallah Bashir

Research in NLP lacks geographic diversity, and the question of how NLP can be scaled to low-resourced languages has not yet been adequately solved.

Machine Translation Translation

656

Paper
Code

Correct Me If You Can: Learning from Error Corrections and Markings

1 code implementation • EAMT 2020 • Julia Kreutzer, Nathaniel Berger, Stefan Riezler

Sequence-to-sequence learning involves a trade-off between signal strength and annotation cost of training data.

Machine Translation reinforcement-learning +2

Paper
Code

On Optimal Transformer Depth for Low-Resource Language Translation

1 code implementation • 9 Apr 2020 • Elan van Biljon, Arnu Pretorius, Julia Kreutzer

Therefore, by showing that transformer models perform well (and often best) at low-to-moderate depth, we hope to convince fellow researchers to devote less computational resources, as well as time, to exploring overly large models during the development of these systems.

Machine Translation NMT +1

Paper
Code

Masakhane -- Machine Translation For Africa

2 code implementations • 13 Mar 2020 • Iroro Orife, Julia Kreutzer, Blessing Sibanda, Daniel Whitenack, Kathleen Siminyu, Laura Martinus, Jamiil Toure Ali, Jade Abbott, Vukosi Marivate, Salomon Kabongo, Musie Meressa, Espoir Murhabazi, Orevaoghene Ahia, Elan van Biljon, Arshath Ramkilowan, Adewale Akinfaderin, Alp Öktem, Wole Akin, Ghollah Kioko, Kevin Degila, Herman Kamper, Bonaventure Dossou, Chris Emezue, Kelechi Ogueji, Abdallah Bashir

Africa has over 2000 languages.

Machine Translation Translation

268

Paper
Code

Joey NMT: A Minimalist NMT Toolkit for Novices

8 code implementations • IJCNLP 2019 • Julia Kreutzer, Jasmijn Bastings, Stefan Riezler

We present Joey NMT, a minimalist neural machine translation toolkit based on PyTorch that is specifically designed for novices.

General Knowledge Machine Translation +2

656

Paper
Code

Self-Regulated Interactive Sequence-to-Sequence Learning

7 code implementations • ACL 2019 • Julia Kreutzer, Stefan Riezler

Not all types of supervision signals are created equal: Different types of feedback have different costs and effects on learning.

Active Learning Machine Translation +1

656

Paper
Code

Learning to Segment Inputs for NMT Favors Character-Level Processing

no code implementations • IWSLT (EMNLP) 2018 • Julia Kreutzer, Artem Sokolov

Most modern neural machine translation (NMT) systems rely on presegmented inputs.

Machine Translation Navigate +3

Paper
Add Code

Explaining and Generalizing Back-Translation through Wake-Sleep

no code implementations • 12 Jun 2018 • Ryan Cotterell, Julia Kreutzer

Back-translation has become a commonly employed heuristic for semi-supervised neural machine translation.

Machine Translation Translation

Paper
Add Code

Reliability and Learnability of Human Bandit Feedback for Sequence-to-Sequence Reinforcement Learning

1 code implementation • ACL 2018 • Julia Kreutzer, Joshua Uyheng, Stefan Riezler

We present a study on reinforcement learning (RL) from human bandit feedback for sequence-to-sequence learning, exemplified by the task of bandit neural machine translation (NMT).

Machine Translation NMT +3

Paper
Code

A Reinforcement Learning Approach to Interactive-Predictive Neural Machine Translation

1 code implementation • 3 May 2018 • Tsz Kin Lam, Julia Kreutzer, Stefan Riezler

We present an approach to interactive-predictive neural machine translation that attempts to reduce human effort from three directions: Firstly, instead of requiring humans to select, correct, or delete segments, we employ the idea of learning from human reinforcements in form of judgments on the quality of partial translations.

Machine Translation reinforcement-learning +2

Paper
Code

Can Neural Machine Translation be Improved with User Feedback?

no code implementations • NAACL 2018 • Julia Kreutzer, Shahram Khadivi, Evgeny Matusov, Stefan Riezler

We present the first real-world application of methods for improving neural machine translation (NMT) with human reinforcement, based on explicit and implicit user feedback collected on the eBay e-commerce platform.

Machine Translation NMT +1

Paper
Add Code

Learning What's Easy: Fully Differentiable Neural Easy-First Taggers

no code implementations • EMNLP 2017 • Andr{\'e} F. T. Martins, Julia Kreutzer

Our models compare favourably to BILSTM taggers on three sequence tagging tasks.

Imitation Learning Named Entity Recognition (NER) +1

Paper
Add Code

A Shared Task on Bandit Learning for Machine Translation

no code implementations • WS 2017 • Artem Sokolov, Julia Kreutzer, Kellen Sunderland, Pavel Danchenko, Witold Szymaniak, Hagen Fürstenau, Stefan Riezler

We introduce and describe the results of a novel shared task on bandit learning for machine translation.

Machine Translation Translation

Paper
Add Code

Bandit Structured Prediction for Neural Sequence-to-Sequence Learning

1 code implementation • ACL 2017 • Julia Kreutzer, Artem Sokolov, Stefan Riezler

Bandit structured prediction describes a stochastic optimization framework where learning is performed from partial feedback.

Domain Adaptation Machine Translation +3

Paper
Code

Learning Structured Predictors from Bandit Feedback for Interactive NLP

no code implementations • ACL 2016 • Artem Sokolov, Julia Kreutzer, Christopher Lo, Stefan Riezler

Machine Translation Stochastic Optimization +2

Paper
Add Code

Stochastic Structured Prediction under Bandit Feedback

1 code implementation • NeurIPS 2016 • Artem Sokolov, Julia Kreutzer, Christopher Lo, Stefan Riezler

Stochastic structured prediction under bandit feedback follows a learning protocol where on each of a sequence of iterations, the learner receives an input, predicts an output structure, and receives partial feedback in form of a task loss evaluation of the predicted structure.

Structured Prediction

Paper
Code

QUality Estimation from ScraTCH (QUETCH): Deep Learning for Word-level Translation Quality Estimation

no code implementations • WS 2015 • Julia Kreutzer, Shigehiko Schamoni, Stefan Riezler

Machine Translation Translation

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.