1 21 3

Kaiyuan Chen

Lucky2022

https://chenky9106.github.io/

AI & ML interests

None yet

Recent Activity

upvoted a paper 6 days ago

Online Experiential Learning for Language Models

upvoted a paper 6 days ago

Spatial-TTT: Streaming Visual-based Spatial Intelligence with Test-Time Training

upvoted a paper 6 days ago

Attention Residuals

View all activity

Organizations

upvoted 3 papers 6 days ago

Online Experiential Learning for Language Models

Paper • 2603.16856 • Published 7 days ago • 55

Spatial-TTT: Streaming Visual-based Spatial Intelligence with Test-Time Training

Paper • 2603.12255 • Published 12 days ago • 90

Attention Residuals

Paper • 2603.15031 • Published 8 days ago • 154

upvoted a paper 14 days ago

\$OneMillion-Bench: How Far are Language Agents from Human Experts?

Paper • 2603.07980 • Published 16 days ago • 27

upvoted a paper about 2 months ago

AgentIF-OneDay: A Task-level Instruction-Following Benchmark for General AI Agents in Daily Scenarios

Paper • 2601.20613 • Published Jan 28 • 10

liked a dataset about 2 months ago

xbench/AgentIF-OneDay

Viewer • Updated Jan 29 • 58 • 636 • 3

updated a dataset about 2 months ago

xbench/AgentIF-OneDay

Viewer • Updated Jan 29 • 58 • 636 • 3

published a dataset 2 months ago

xbench/AgentIF-OneDay

Viewer • Updated Jan 29 • 58 • 636 • 3

upvoted a paper 2 months ago

BabyVision: Visual Reasoning Beyond Language

Paper • 2601.06521 • Published Jan 10 • 200

upvoted a paper 3 months ago

On the Interplay of Pre-Training, Mid-Training, and RL on Reasoning Language Models

Paper • 2512.07783 • Published Dec 8, 2025 • 39

upvoted a paper 4 months ago

P1: Mastering Physics Olympiads with Reinforcement Learning

Paper • 2511.13612 • Published Nov 17, 2025 • 134

authored a paper 4 months ago

Virtual Width Networks

Paper • 2511.11238 • Published Nov 14, 2025 • 38

upvoted 2 papers 4 months ago

Virtual Width Networks

Paper • 2511.11238 • Published Nov 14, 2025 • 38

Lumine: An Open Recipe for Building Generalist Agents in 3D Open Worlds

Paper • 2511.08892 • Published Nov 12, 2025 • 214

upvoted a collection 7 months ago

Seed-OSS

Collection

Seed-OSS Open-Source Models • 3 items • Updated Aug 20, 2025 • 61

authored a paper 9 months ago

xbench: Tracking Agents Productivity Scaling with Profession-Aligned Real-World Evaluations

Paper • 2506.13651 • Published Jun 16, 2025 • 8

upvoted a paper 9 months ago

xbench: Tracking Agents Productivity Scaling with Profession-Aligned Real-World Evaluations

Paper • 2506.13651 • Published Jun 16, 2025 • 8

liked 2 datasets 9 months ago

xbench/ScienceQA

Viewer • Updated Jun 18, 2025 • 100 • 88 • 8

xbench/DeepSearch

Viewer • Updated Jun 18, 2025 • 100 • 286 • 12

upvoted a paper 10 months ago

MMaDA: Multimodal Large Diffusion Language Models

Paper • 2505.15809 • Published May 21, 2025 • 98

Kaiyuan Chen

AI & ML interests

Recent Activity

Organizations

Lucky2022's activity