Hunter Jiang's picture

Hunter Jiang

HunterJiang97

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

Supervised Fine-Tuning versus Reinforcement Learning: A Study of Post-Training Methods for Large Language Models

new activity 18 days ago

HunterJiang97/PABU-Data:[bot] Conversion to Parquet

commentedon a paper about 1 month ago

PABU: Progress-Aware Belief Update for Efficient LLM Agents

View all activity

Organizations

None yet

upvoted a paper 3 days ago

Supervised Fine-Tuning versus Reinforcement Learning: A Study of Post-Training Methods for Large Language Models

Paper • 2603.13985 • Published 6 days ago • 9

upvoted a paper about 1 year ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22, 2025 • 443