15 11 14

Peng Shangpin

psp-dada

https://github.com/pspdada

AI & ML interests

Multimodal Large Language Models, Preference Optimization, Algorithm

Recent Activity

published a model about 1 hour ago

psp-dada/Llama-3-8B-Base-SFT-Uni-DPO-v2-GPT-4

published a dataset about 1 hour ago

psp-dada/Uni-DPO

published a model about 1 hour ago

psp-dada/Llama-3-8B-Base-SFT-Uni-DPO

View all activity

Organizations

None yet

Collections 2

Papers 3

arxiv:2511.19575

arxiv:2507.12455

arxiv:2506.10054

models 12

datasets 2

psp-dada/Uni-DPO

Updated about 5 hours ago

psp-dada/SENTINEL

Updated 5 days ago • 171 • 1

Peng Shangpin

AI & ML interests

Recent Activity

Organizations

Collections 2

Omni-DPO: A Dual-Perspective Paradigm for Dynamic Preference Learning of LLMs

psp-dada/Uni-DPO

psp-dada/Llama-3-8B-Instruct-Uni-DPO-v2-GPT-4o

psp-dada/Llama-3-8B-Base-SFT-Uni-DPO

psp-dada/LLaVA-v1.5-7B-SENTINEL

psp-dada/LLaVA-v1.5-13B-SENTINEL

psp-dada/LLaVA-v1.6-Vicuna-7B-SENTINEL

psp-dada/LLaVA-v1.6-Vicuna-13B-SENTINEL

Omni-DPO: A Dual-Perspective Paradigm for Dynamic Preference Learning of LLMs

psp-dada/Uni-DPO

psp-dada/Llama-3-8B-Instruct-Uni-DPO-v2-GPT-4o

psp-dada/Llama-3-8B-Base-SFT-Uni-DPO

psp-dada/LLaVA-v1.5-7B-SENTINEL

psp-dada/LLaVA-v1.5-13B-SENTINEL

psp-dada/LLaVA-v1.6-Vicuna-7B-SENTINEL

psp-dada/LLaVA-v1.6-Vicuna-13B-SENTINEL

Papers 3

models 12

psp-dada/Llama-3-8B-Base-SFT-Uni-DPO

psp-dada/Llama-3-8B-Instruct-Uni-DPO-v2-GPT-4o

psp-dada/Qwen2.5-Math-7B-Uni-DPO

psp-dada/Llama-3-8B-Base-SFT-Uni-DPO-v2-GPT-4

psp-dada/Llama-3-8B-Instruct-Uni-DPO

psp-dada/Qwen2.5-VL-7B-Instruct-SENTINEL

psp-dada/Qwen2-VL-7B-Instruct-SENTINEL

psp-dada/Qwen2-VL-2B-Instruct-SENTINEL

psp-dada/LLaVA-v1.6-Vicuna-13B-SENTINEL

psp-dada/LLaVA-v1.6-Vicuna-7B-SENTINEL

datasets 2

psp-dada/Uni-DPO

psp-dada/SENTINEL

Peng Shangpin

AI & ML interests

Recent Activity

Organizations

Collections 2

Papers 3

models 12 Sort: Recently updated

datasets 2 Sort: Recently updated

models 12

datasets 2