Adithya S K's picture

Adithya S K

AdithyaSK

huggingface

·

https://adithyask.com/

AI & ML interests

None yet

Recent Activity

updated a Space 1 day ago

AdithyaSK/desktop-openenv

published a Space 1 day ago

AdithyaSK/desktop-openenv

liked a Space 3 days ago

HuggingFaceTB/trl-distillation-trainer

View all activity

Organizations

upvoted an article 16 days ago

Article

Keep the Tokens Flowing: Lessons from 16 Open-Source RL Libraries

+7

Mar 10

•

124

upvoted 2 papers 8 months ago

Manimator: Transforming Research Papers into Visual Explanations

Paper • 2507.14306 • Published Jul 18, 2025 • 4

Aryabhata: An exam-focused language model for JEE Math

Paper • 2508.08665 • Published Aug 12, 2025 • 17

upvoted an article 9 months ago

Article

Transformers backend integration in SGLang

+3

Jun 23, 2025

•

56

upvoted a paper over 1 year ago

Task Preference Optimization: Improving Multimodal Large Language Models with Vision Task Alignment

Paper • 2412.19326 • Published Dec 26, 2024 • 18

upvoted a collection over 1 year ago

🤖 Agents

21 items • Updated Dec 31, 2024 • 173

upvoted 3 papers over 1 year ago

ChatRex: Taming Multimodal LLM for Joint Perception and Understanding

Paper • 2411.18363 • Published Nov 27, 2024 • 10

LEOPARD : A Vision Language Model For Text-Rich Multi-Image Tasks

Paper • 2410.01744 • Published Oct 2, 2024 • 27

TrOCR: Transformer-based Optical Character Recognition with Pre-trained Models

Paper • 2109.10282 • Published Sep 21, 2021 • 13

upvoted a collection over 1 year ago

Medical Multimodal Datasets

Datasets that can be used to train and/or evaluate medical multimodal models. • 3 items • Updated Dec 9, 2023 • 2

upvoted a paper almost 2 years ago

StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation

Paper • 2405.01434 • Published May 2, 2024 • 56

upvoted a paper about 2 years ago

Aya Model: An Instruction Finetuned Open-Access Multilingual Language Model

Paper • 2402.07827 • Published Feb 12, 2024 • 48

upvoted 2 papers over 2 years ago

VideoDirectorGPT: Consistent Multi-scene Video Generation via LLM-Guided Planning

Paper • 2309.15091 • Published Sep 26, 2023 • 35

Kosmos-2.5: A Multimodal Literate Model

Paper • 2309.11419 • Published Sep 20, 2023 • 56