Kyutai

non-profit

Verified

https://kyutai.org/

kyutai_labs

kyutai-labs

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

t0m1ab published a model about 2 hours ago

kyutai/hibiki-zero-3b-pytorch-bf16

t0m1ab published a dataset about 2 hours ago

kyutai/Audio-NTREX-4L

t0m1ab updated a Space about 3 hours ago

kyutai/hibiki-zero-samples

View all activity

Papers

CASA: Cross-Attention via Self-Attention for Efficient Vision-Language Fusion

ARC-Encoder: learning compressed text representations for large language models

View all Papers

kyutai 's collections 9

Hibiki-Zero

Running

1

Hibiki Zero Samples

🏆

1

Demo samples of the speech translation model Hibiki-Zero.
kyutai/hibiki-zero-3b-pytorch-bf16

Audio-to-Audio • Updated about 5 hours ago • 163 • 5
kyutai/Audio-NTREX-4L

Updated about 5 hours ago • 33

ARC-Encoders

Pretrained ARC-Encoders and a fine-tuning dataset: context compression for unmodified LLMs.

ARC-Encoder: learning compressed text representations for large language models

Paper • 2510.20535 • Published Oct 23, 2025 • 8
kyutai/ARC8_Encoder_Llama

Feature Extraction • Updated Nov 5, 2025 • 12 • 2
kyutai/ARC_finetuning

Preview • Updated Oct 24, 2025 • 8
kyutai/ARC8_Encoder_multi

Feature Extraction • Updated Nov 5, 2025 • 18 • 6

Speech-To-Text

https://kyutai.org/next/stt

kyutai/stt-2.6b-en

Automatic Speech Recognition • Updated Jun 26, 2025 • 118
kyutai/stt-1b-en_fr

Automatic Speech Recognition • Updated Nov 18, 2025 • 115
kyutai/stt-1b-en_fr-mlx

Automatic Speech Recognition • Updated Jun 19, 2025 • 5
kyutai/stt-2.6b-en-mlx

Automatic Speech Recognition • Updated Jun 19, 2025 • 7

MoshiVis v0.1

MoshiVis is a Vision Speech Model built as a perceptually-augmented version of Moshi v0.1 for conversing about image inputs

Vision-Speech Models: Teaching Speech Models to Converse about Images

Paper • 2503.15633 • Published Mar 19, 2025 • 2
kyutai/Babillage

Viewer • Updated Mar 21, 2025 • 465k • 118 • 13
kyutai/moshika-vis-pytorch-bf16

Updated Jun 18, 2025 • 56
kyutai/moshika-vis-candle-bf16

Updated Mar 18, 2025 • 1

Moshi v0.1 Release

MLX, Candle & PyTorch model checkpoints released as part of the Moshi release from Kyutai. Run inference via: https://github.com/kyutai-labs/moshi

Moshi: a speech-text foundation model for real-time dialogue

Paper • 2410.00037 • Published Sep 17, 2024 • 11
kyutai/moshiko-pytorch-bf16

Updated Sep 18, 2024 • 131k • 227
kyutai/moshika-pytorch-bf16

Updated Sep 18, 2024 • 61.4k • 59
kyutai/mimi

Feature Extraction • 96.2M • Updated Jul 2, 2025 • 509k • • 288

CASA

CASA: Cross-Attention as Self-Attention for Efficient Vision-Language Fusion on long context streaming inputs

Running

2

CASA Gallery

🏠

2

Video Gallery for CASA: Cross-Attention via Self-Attention
CASA: Cross-Attention via Self-Attention for Efficient Vision-Language Fusion

Paper • 2512.19535 • Published Dec 22, 2025 • 12
kyutai/CASA-Helium1-VL-2B

Image-Text-to-Text • 3B • Updated Dec 23, 2025 • 59 • 7
kyutai/CASA-Qwen2_5-VL-3B

Image-Text-to-Text • 4B • Updated Dec 23, 2025 • 263 • 2

Text-To-Speech

https://kyutai.org/next/tts

kyutai/pocket-tts

Updated 24 days ago • 62.8k • 540
kyutai/pocket-tts-without-voice-cloning

Text-to-Speech • Updated 29 days ago • 87.8k • 14
kyutai/tts-1.6b-en_fr

Text-to-Speech • Updated Sep 11, 2025 • 78.5k • 367
kyutai/tts-voices

Updated 17 days ago • 127

Helium 1

Helium 1: a modular and multilingual LLM

kyutai/helium-1-2b

Text Generation • 2B • Updated Apr 30, 2025 • 8.66k • 49
kyutai/helium-1-2b-books

Text Generation • 2B • Updated Apr 30, 2025 • 40 • 1
kyutai/helium-1-2b-hum

Text Generation • 2B • Updated Apr 30, 2025 • 28
kyutai/helium-1-2b-life

Text Generation • 2B • Updated Apr 30, 2025 • 24 • 1

Hibiki fr-en

Hibiki is a model for streaming speech translation , which can run on device! See https://github.com/kyutai-labs/hibiki.

Running

51

Hibiki Samples

🤗

51

Translate speech in real-time with high fidelity
High-Fidelity Simultaneous Speech-To-Speech Translation

Paper • 2502.03382 • Published Feb 5, 2025 • 8
kyutai/hibiki-1b-mlx-bf16

Translation • Updated Feb 6, 2025 • 35 • 29
kyutai/hibiki-2b-mlx-bf16

Translation • Updated Feb 6, 2025 • 19 • 22