Yuan-Li-FNLP's picture

3 2

Yuan-Li-FNLP

Yuan-Li-FNLP

·

AI & ML interests

None yet

Recent Activity

authored a paper about 22 hours ago

BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning

upvoted a paper 1 day ago

BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning

updated a model 5 days ago

Yuan-Li-FNLP/R3-RAG-Qwen

View all activity

Organizations

None yet

Papers 1

arxiv:2603.04918

models 5

Yuan-Li-FNLP/R3-RAG-Qwen

8B • Updated 5 days ago • 9 • 1

Yuan-Li-FNLP/R3-RAG-Llama-ORM

8B • Updated May 26, 2025

Yuan-Li-FNLP/R3-RAG-CS-Llama

Text Generation • 8B • Updated May 26, 2025

Yuan-Li-FNLP/R3-RAG-CS-Qwen

Text Generation • 8B • Updated May 26, 2025 • 1 • 1

Yuan-Li-FNLP/R3-RAG-Llama

8B • Updated May 26, 2025

datasets 2

Yuan-Li-FNLP/R3-RAG-RLTrainingData

Viewer • Updated May 27, 2025 • 8.19k • 6

Yuan-Li-FNLP/R3-RAG-ColdStartTrainingData

Viewer • Updated May 27, 2025 • 178k • 14 • 2