2 2 2

Hunter Jiang

HunterJiang97

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

Supervised Fine-Tuning versus Reinforcement Learning: A Study of Post-Training Methods for Large Language Models

new activity 18 days ago

HunterJiang97/PABU-Data:[bot] Conversion to Parquet

commentedon a paper about 1 month ago

PABU: Progress-Aware Belief Update for Efficient LLM Agents

View all activity

Organizations

None yet

upvoted a paper 3 days ago

Supervised Fine-Tuning versus Reinforcement Learning: A Study of Post-Training Methods for Large Language Models

Paper • 2603.13985 • Published 6 days ago • 9

New activity in HunterJiang97/PABU-Data 18 days ago

[bot] Conversion to Parquet

#1 opened about 1 month ago by

parquet-converter

commented a paper about 1 month ago

PABU: Progress-Aware Belief Update for Efficient LLM Agents

Paper • 2602.09138 • Published Feb 9 •

updated a dataset about 1 month ago

HunterJiang97/PABU-Data

Viewer • Updated Feb 12 • 128k • 15

updated a model about 1 month ago

HunterJiang97/PABU-Agent-8B

Question Answering • 8B • Updated Feb 12 • 2

updated a collection about 1 month ago

PABU-Implementation

Collection

published a model about 1 month ago

HunterJiang97/PABU-Agent-8B

Question Answering • 8B • Updated Feb 12 • 2

published a dataset about 1 month ago

HunterJiang97/PABU-Data

Viewer • Updated Feb 12 • 128k • 15

updated a Space 3 months ago

Trl Trackio

🚀

published a Space 3 months ago

Trl Trackio

🚀

liked a model 9 months ago

answerdotai/ModernBERT-base

Fill-Mask • 0.1B • Updated Jan 15, 2025 • 2.9M • 1.01k

liked a dataset 11 months ago

zwhe99/DeepMath-103K

Viewer • Updated May 29, 2025 • 103k • 5.95k • 356

upvoted a paper about 1 year ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22, 2025 • 443

Hunter Jiang

AI & ML interests

Recent Activity

Organizations

HunterJiang97's activity

[bot] Conversion to Parquet

Trl Trackio

Trl Trackio