Text & Image Datasets
updated
airtrain-ai/fineweb-edu-fortified
Viewer
• Updated • 322M • 1.53k
• 54
Viewer
• Updated • 1.29B • 15.4k
• 338
Viewer
• Updated • 63.1M • 261
• 26
Viewer
• Updated • 2.87B • 597
• 12
Viewer
• Updated • 113k • 79
• 1
chestnutlzj/LaTeX_OCR_384x384
Viewer
• Updated • 76.3k • 23
Viewer
• Updated • 5.65M • 112
• 2
laicsiifes/flickr30k-pt-br
Viewer
• Updated • 31k • 39
• 4
Rapidata/Flux-2-pro_t2i_human_preference
Viewer
• Updated • 44.9k • 942
• 11
Viewer
• Updated • 14.8M • 40.7k
• 117
Viewer
• Updated • 24.2M • 85.4k
• 483
Viewer
• Updated • 122k • 15.5k
• 75
KBlueLeaf/coyo11m-256px-ccrop-latent
Viewer
• Updated • 9.16M • 30
• 4
HuggingFaceM4/the_cauldron
Viewer
• Updated • 1.88M • 33.4k
• 526
Viewer
• Updated • 770k • 22.6k
• 32
Viewer
• Updated • 174k • 21
• 3
BLIP3o/BLIP3o-Pretrain-Long-Caption
Viewer
• Updated • 27.2M • 5.93k
• 59
Viewer
• Updated • 97.2M • 5.7k
• 7
Viewer
• Updated • 936k • 92.6k
• 341
Viewer
• Updated • 68M • 25.9k
• 259
Viewer
• Updated • 200k • 3.72k
• 88
lightonai/LightOnOCR-mix-0126
Viewer
• Updated • 16.4M • 651
• 112
Viewer
• Updated • 395M • 8.18k
• 28
karpathy/tinystories-gpt4-clean
Viewer
• Updated • 2.73M • 2.25k
• 71