QRQ's picture

QRQ

RichardQRQ

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 4 days ago

CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation

upvoted a paper 5 days ago

Enhancing Spatial Understanding in Image Generation via Reward Modeling

upvoted a paper 5 days ago

dLLM: Simple Diffusion Language Modeling

View all activity

Organizations

None yet

upvoted a paper 4 days ago

CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation

Paper • 2602.24286 • Published 8 days ago • 76

upvoted 2 papers 5 days ago

Enhancing Spatial Understanding in Image Generation via Reward Modeling

Paper • 2602.24233 • Published 8 days ago • 47

dLLM: Simple Diffusion Language Modeling

Paper • 2602.22661 • Published 9 days ago • 117

upvoted a paper 8 days ago

OmniGAIA: Towards Native Omni-Modal AI Agents

Paper • 2602.22897 • Published 9 days ago • 51

upvoted 2 papers 10 days ago

On Data Engineering for Scaling LLM Terminal Capabilities

Paper • 2602.21193 • Published 11 days ago • 90

PyVision-RL: Forging Open Agentic Vision Models via RL

Paper • 2602.20739 • Published 11 days ago • 29

upvoted 2 papers 23 days ago

Towards Autonomous Mathematics Research

Paper • 2602.10177 • Published 25 days ago • 36

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

Paper • 2602.10604 • Published 24 days ago • 187

upvoted a paper 24 days ago

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

Paper • 2602.05400 • Published about 1 month ago • 343

upvoted a paper 26 days ago

POINTS-GUI-G: GUI-Grounding Journey

Paper • 2602.06391 • Published 29 days ago • 17

upvoted 6 papers about 1 month ago

Green-VLA: Staged Vision-Language-Action Model for Generalist Robots

Paper • 2602.00919 • Published Jan 31 • 312

Innovator-VL: A Multimodal Large Language Model for Scientific Discovery

Paper • 2601.19325 • Published Jan 27 • 79

Visual Generation Unlocks Human-Like Reasoning through Multimodal World Models

Paper • 2601.19834 • Published Jan 27 • 25

daVinci-Dev: Agent-native Mid-training for Software Engineering

Paper • 2601.18418 • Published Jan 26 • 126

SWE-Pruner: Self-Adaptive Context Pruning for Coding Agents

Paper • 2601.16746 • Published Jan 23 • 89

LLM-in-Sandbox Elicits General Agentic Intelligence

Paper • 2601.16206 • Published Jan 22 • 85

upvoted 4 papers about 2 months ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 155

Unlocking Implicit Experience: Synthesizing Tool-Use Trajectories from Text

Paper • 2601.10355 • Published Jan 15 • 39

Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning

Paper • 2601.06943 • Published Jan 11 • 214

ET-Agent: Incentivizing Effective Tool-Integrated Reasoning Agent via Behavior Calibration

Paper • 2601.06860 • Published Jan 11 • 16