euclaise

https://euclaise.xyz

euclaise

AI & ML interests

None yet

Recent Activity

liked a model about 9 hours ago

Qwen/Qwen3.5-35B-A3B

liked a model about 9 hours ago

Qwen/Qwen3.5-27B

upvoted a paper about 10 hours ago

On the "Induction Bias" in Sequence Models

View all activity

Organizations

liked 2 models about 9 hours ago

Qwen/Qwen3.5-35B-A3B

Image-Text-to-Text • 36B • Updated 1 day ago • 158k • 468

Qwen/Qwen3.5-27B

Image-Text-to-Text • 28B • Updated 1 day ago • 41.1k • 318

upvoted a paper about 10 hours ago

On the "Induction Bias" in Sequence Models

Paper • 2602.18333 • Published 6 days ago • 3

upvoted 2 papers about 16 hours ago

Untied Ulysses: Memory-Efficient Context Parallelism via Headwise Chunking

Paper • 2602.21196 • Published 1 day ago • 3

One-step Language Modeling via Continuous Denoising

Paper • 2602.16813 • Published 8 days ago • 4

liked a model 2 days ago

xTimeCrystal/MiniModel-200M-Base

Text Generation • Updated 3 days ago • 12 • 30

liked a dataset 2 days ago

ronantakizawa/github-top-code

Viewer • Updated 3 days ago • 1.12M • 593 • 72

liked a model 3 days ago

jdopensource/JoyAI-LLM-Flash

Text Generation • 49B • Updated about 5 hours ago • 1.33k • 154

upvoted an article 3 days ago

Article

Differential Transformer V2

Jan 20

•

upvoted a paper 5 days ago

2Mamba2Furious: Linear in Complexity, Competitive in Accuracy

Paper • 2602.17363 • Published 7 days ago • 7

liked 2 models 5 days ago

trillionlabs/Tri-21B

Text Generation • 21B • Updated 7 days ago • 3.03k • 45

aloobun/teeny-s

Text Generation • Updated 5 days ago • 1

upvoted 3 papers 6 days ago

Nanbeige4.1-3B: A Small General Model that Reasons, Aligns, and Acts

Paper • 2602.13367 • Published 13 days ago • 30

On Surprising Effectiveness of Masking Updates in Adaptive Optimizers

Paper • 2602.15322 • Published 9 days ago • 9

SpargeAttention2: Trainable Sparse Attention via Hybrid Top-k+Top-p Masking and Distillation Fine-Tuning

Paper • 2602.13515 • Published 12 days ago • 43

liked 3 models 11 days ago

upvoted 2 papers 12 days ago

Beyond Log Likelihood: Probability-Based Objectives for Supervised Fine-Tuning across the Model Capability Continuum

Paper • 2510.00526 • Published Oct 1, 2025 • 10

Dynamic Long Context Reasoning over Compressed Memory via End-to-End Reinforcement Learning

Paper • 2602.08382 • Published 17 days ago • 10

euclaise

AI & ML interests

Recent Activity

Organizations

euclaise's activity

Differential Transformer V2