Search Results for author: Kyle O'Brien

Found 2 papers, 2 papers with code

Improving Black-box Robustness with In-Context Rewriting

1 code implementation • 13 Feb 2024 • Kyle O'Brien, Nathan Ng, Isha Puri, Jorge Mendez, Hamid Palangi, Yoon Kim, Marzyeh Ghassemi, Thomas Hartvigsen

Most techniques for improving OOD robustness are not applicable to settings where the model is effectively a black box, such as when the weights are frozen, retraining is costly, or the model is leveraged via an API.

News Classification

Paper
Code

Pythia: A Suite for Analyzing Large Language Models Across Training and Scaling

4 code implementations • 3 Apr 2023 • Stella Biderman, Hailey Schoelkopf, Quentin Anthony, Herbie Bradley, Kyle O'Brien, Eric Hallahan, Mohammad Aflah Khan, Shivanshu Purohit, USVSN Sai Prashanth, Edward Raff, Aviya Skowron, Lintang Sutawika, Oskar van der Wal

How do large language models (LLMs) develop and evolve over the course of training?

Ranked #4 on Language Modelling on LAMBADA (Perplexity metric)

Common Sense Reasoning Coreference Resolution +3

6,896

Paper
Code

Cannot find the paper you are looking for? You can Submit a new open access paper.