SiliangZ (Siliang Zeng)

spaces 1

Wiki Tool Use

📈

models 19

datasets 26

SiliangZ/mistral_irl3_rm_data_idpo

Viewer • Updated Jan 21, 2025 • 208k • 4

SiliangZ/mistral_irl3_rm_data_combined_idpo

Viewer • Updated Jan 20, 2025 • 624k • 3

SiliangZ/mistral_irl2_rm_data_combined_idpo

Viewer • Updated Nov 30, 2024 • 416k • 5

SiliangZ/AIHF_Online_RLHF_Iter2

Viewer • Updated Nov 18, 2024 • 20k • 6

SiliangZ/AIHF_Online_RLHF_Iter1

Viewer • Updated Nov 17, 2024 • 20k • 6

SiliangZ/ultrafeedback_with_demo_sft_pairs_temp07

Viewer • Updated Nov 14, 2024 • 269k • 5

SiliangZ/ultrachat_200k_mistral_sft_iter1_iter2_temp1_generations

Viewer • Updated Oct 30, 2024 • 624k • 5

SiliangZ/ultrachat_200k_mistral_sft_temp1_iter1

Viewer • Updated Oct 25, 2024 • 416k • 5

SiliangZ/ultrachat_200k_mistral_sft_and_mistral_irl1_round1_temp07

Viewer • Updated Oct 25, 2024 • 416k • 4 • 1

SiliangZ/ultrachat_200k_mistral_sft_temp1

Viewer • Updated Oct 24, 2024 • 231k • 5

View 26 datasets

Siliang Zeng

AI & ML interests

Organizations

spaces 1

Wiki Tool Use

models 19

SiliangZ/zephyr-7b-dpo-full

SiliangZ/mistral-irl-iter2-iterative-dpo

SiliangZ/RM_Zephyr_dpo_init_ultrafeedbck_lr_5e7

SiliangZ/RM_Zephyr_dpo_init_ultrafeedbck_lr_5e6

SiliangZ/RM_Mistral_sft_init_ultrafeedbck_lr_5e7

SiliangZ/RM_Mistral_sft_init_ultrafeedbck_lr_5e6

SiliangZ/RM_mistral_irl2_initilized_from_sft_lr_5e7_idpo

SiliangZ/RM_mistral_irl2_initilized_from_irl1_rm_lr_5e7_idpo

SiliangZ/RM_mistral_7b_sft_beta_ultrachat_200k_mistral_sft_temp07_lr_5e7

SiliangZ/mistral-7b-sft-beta-rm-mistral-sft-temp07-lr-5e7-iter1

datasets 26

SiliangZ/mistral_irl3_rm_data_idpo

SiliangZ/mistral_irl3_rm_data_combined_idpo

SiliangZ/mistral_irl2_rm_data_combined_idpo

SiliangZ/AIHF_Online_RLHF_Iter2

SiliangZ/AIHF_Online_RLHF_Iter1

SiliangZ/ultrafeedback_with_demo_sft_pairs_temp07

SiliangZ/ultrachat_200k_mistral_sft_iter1_iter2_temp1_generations

SiliangZ/ultrachat_200k_mistral_sft_temp1_iter1

SiliangZ/ultrachat_200k_mistral_sft_and_mistral_irl1_round1_temp07

SiliangZ/ultrachat_200k_mistral_sft_temp1

Siliang Zeng

AI & ML interests

Organizations

spaces 1

Wiki Tool Use

models 19 Sort: Recently updated

datasets 26 Sort: Recently updated

models 19

datasets 26