Search Results for author: Daniel Whitenack

Found 6 papers, 4 papers with code

Participatory Research for Low-resourced Machine Translation: A Case Study in African Languages

4 code implementations • Findings of the Association for Computational Linguistics 2020 • Wilhelmina Nekoto, Vukosi Marivate, Tshinondiwa Matsila, Timi Fasubaa, Tajudeen Kolawole, Taiwo Fagbohungbe, Solomon Oluwole Akinola, Shamsuddeen Hassan Muhammad, Salomon Kabongo, Salomey Osei, Sackey Freshia, Rubungo Andre Niyongabo, Ricky Macharm, Perez Ogayo, Orevaoghene Ahia, Musie Meressa, Mofe Adeyemi, Masabata Mokgesi-Selinga, Lawrence Okegbemi, Laura Jane Martinus, Kolawole Tajudeen, Kevin Degila, Kelechi Ogueji, Kathleen Siminyu, Julia Kreutzer, Jason Webster, Jamiil Toure Ali, Jade Abbott, Iroro Orife, Ignatius Ezeani, Idris Abdulkabir Dangana, Herman Kamper, Hady Elsahar, Goodness Duru, Ghollah Kioko, Espoir Murhabazi, Elan van Biljon, Daniel Whitenack, Christopher Onyefuluchi, Chris Emezue, Bonaventure Dossou, Blessing Sibanda, Blessing Itoro Bassey, Ayodele Olabiyi, Arshath Ramkilowan, Alp Öktem, Adewale Akinfaderin, Abdallah Bashir

Research in NLP lacks geographic diversity, and the question of how NLP can be scaled to low-resourced languages has not yet been adequately solved.

Machine Translation Translation

656

Paper
Code

Masakhane -- Machine Translation For Africa

2 code implementations • 13 Mar 2020 • Iroro Orife, Julia Kreutzer, Blessing Sibanda, Daniel Whitenack, Kathleen Siminyu, Laura Martinus, Jamiil Toure Ali, Jade Abbott, Vukosi Marivate, Salomon Kabongo, Musie Meressa, Espoir Murhabazi, Orevaoghene Ahia, Elan van Biljon, Arshath Ramkilowan, Adewale Akinfaderin, Alp Öktem, Wole Akin, Ghollah Kioko, Kevin Degila, Herman Kamper, Bonaventure Dossou, Chris Emezue, Kelechi Ogueji, Abdallah Bashir

Africa has over 2000 languages.

Machine Translation Translation

268

Paper
Code

Katecheo: A Portable and Modular System for Multi-Topic Question Answering

1 code implementation • 1 Jul 2019 • Shirish Hirekodi, Seban Sunny, Leonard Topno, Alwin Daniel, Daniel Whitenack, Reuben Skewes, Stuart Cranney

We introduce a modular system that can be deployed on any Kubernetes cluster for question answering via REST API.

Question Answering Reading Comprehension

Paper
Code

Phone-ing it in: Towards Flexible Multi-Modal Language Model Training by Phonetic Representations of Data

1 code implementation • ACL 2022 • Colin Leong, Daniel Whitenack

However, many advances in language model pre-training are focused on text, a fact that only increases systematic inequalities in the performance of NLP tasks across the world’s languages.

Language Modelling named-entity-recognition +2

Paper
Code

Dyn-ASR: Compact, Multilingual Speech Recognition via Spoken Language and Accent Identification

no code implementations • 4 Aug 2021 • Sangeeta Ghangam, Daniel Whitenack, Joshua Nemecek

Running automatic speech recognition (ASR) on edge devices is non-trivial due to resource constraints, especially in scenarios that require supporting multiple languages.

Automatic Speech Recognition Automatic Speech Recognition (ASR) +2

Paper
Add Code

Bloom Library: Multimodal Datasets in 300+ Languages for a Variety of Downstream Tasks

no code implementations • 26 Oct 2022 • Colin Leong, Joshua Nemecek, Jacob Mansdorfer, Anna Filighera, Abraham Owodunni, Daniel Whitenack

We present Bloom Library, a linguistically diverse set of multimodal and multilingual datasets for language modeling, image captioning, visual storytelling, and speech synthesis/recognition.

Image Captioning Language Modelling +2

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.