Search Results for author: Kaiwen Xue

Found 2 papers, 2 papers with code

One Transformer Fits All Distributions in Multi-Modal Diffusion at Scale

3 code implementations • 12 Mar 2023 • Fan Bao, Shen Nie, Kaiwen Xue, Chongxuan Li, Shi Pu, Yaole Wang, Gang Yue, Yue Cao, Hang Su, Jun Zhu

Inspired by the unified view, UniDiffuser learns all distributions simultaneously with a minimal modification to the original diffusion model -- perturbs data in all modalities instead of a single modality, inputs individual timesteps in different modalities, and predicts the noise of all modalities instead of a single modality.

Text-to-Image Generation

5,993

Paper
Code

All are Worth Words: A ViT Backbone for Diffusion Models

3 code implementations • CVPR 2023 • Fan Bao, Shen Nie, Kaiwen Xue, Yue Cao, Chongxuan Li, Hang Su, Jun Zhu

We evaluate U-ViT in unconditional and class-conditional image generation, as well as text-to-image generation tasks, where U-ViT is comparable if not superior to a CNN-based U-Net of a similar size.

Ranked #4 on Text-to-Image Generation on MS COCO

Conditional Image Generation Text-to-Image Generation

642

Paper
Code

Cannot find the paper you are looking for? You can Submit a new open access paper.