Luckeciano Carvalho Melo's picture

Luckeciano Carvalho Melo

luckeciano

·

https://luckeciano.github.io

AI & ML interests

Reinforcement Learning

Organizations

luckeciano 's datasets 19

luckeciano/pku-llama3.1-8b-dataset-test-generations

Viewer • Updated Jan 31, 2025 • 4.7M • 8

luckeciano/pku-llama3.1-8b-dataset-train-generations

Viewer • Updated Jan 31, 2025 • 1.36M • 21

luckeciano/pku-alpaca3.1-8b-eval-gt-rewards

Viewer • Updated Sep 20, 2024 • 4.7k • 2

luckeciano/pku-alpaca3.1-8b-gt-rewards

Viewer • Updated Sep 10, 2024 • 6.05M • 3

luckeciano/pku-llama3.1-8b-answers-features-test

Viewer • Updated Sep 8, 2024 • 4.42M • 3

luckeciano/pku-llama3.1-8b-answers-features-train

Viewer • Updated Sep 6, 2024 • 1.28M • 19

luckeciano/pku-llama3.1-8b-dataset-features-gt-reward-modeling

Updated Sep 4, 2024 • 3

luckeciano/pku-llama3.1-8b-dataset-features

Viewer • Updated Sep 3, 2024 • 18.3k • 3

luckeciano/PKU-SafeRLHF-Shifts

Viewer • Updated Aug 26, 2024 • 18.3k • 6

luckeciano/mistral8x22b-reddit-post-features

Viewer • Updated May 10, 2024 • 92.9k • 58

luckeciano/llama370b-reddit-post-features

Viewer • Updated May 10, 2024 • 82.5k • 212

luckeciano/llama370b-features-reddit

Viewer • Updated May 7, 2024 • 150k • 9

luckeciano/mistral8x22b-features-reddit

Viewer • Updated Apr 22, 2024 • 166k • 4

luckeciano/hermes-reddit-post-features

Viewer • Updated Apr 18, 2024 • 92.7k • 31

luckeciano/llama27b-features-reddit

Viewer • Updated Apr 13, 2024 • 189k • 3

luckeciano/falcon7b-features-reddit

Viewer • Updated Apr 13, 2024 • 159k • 21

luckeciano/hermes-features-ultrafeedback

Viewer • Updated Mar 7, 2024 • 63.8k • 17

luckeciano/reddit-features-hermes

Viewer • Updated Feb 13, 2024 • 169k • 4

luckeciano/learning-to-summarize

Viewer • Updated Jan 17, 2024 • 426k • 5 • 1