DINOv2 - a facebook Collection

facebook 's Collections

perception-encoder-audio-visual

Physics of Language Models: Part 4.2

Perception Encoder

Seamless Communication

Robust Wav2Vec 2.0

Fairseq S^2 TTS

MusicGen Stereo

FAIR's LayerSkip Llama models

DINOv2

updated Aug 13, 2025

DINOv2: foundation models producing robust visual features suitable for image-level and pixel-level visual tasks - https://arxiv.org/abs/2304.07193