Robert Shaw's picture

Robert Shaw

robertgshaw2

·

rsnm2

AI & ML interests

None yet

Organizations

upvoted a paper over 1 year ago

"Give Me BF16 or Give Me Death"? Accuracy-Performance Trade-Offs in LLM Quantization

Paper • 2411.02355 • Published Nov 4, 2024 • 52

upvoted a collection over 1 year ago

Llama-3.1 Quantization

Neural Magic quantized Llama-3.1 models • 21 items • Updated 28 days ago • 46

upvoted a collection almost 2 years ago

FP8 LLMs for vLLM

Accurate FP8 quantized models by Neural Magic, ready for use with vLLM! • 42 items • Updated 28 days ago • 79

upvoted a paper over 2 years ago

Direct Preference Optimization: Your Language Model is Secretly a Reward Model

Paper • 2305.18290 • Published May 29, 2023 • 64

upvoted a collection over 2 years ago

Open LLM Leaderboard best models ❤️‍🔥

A daily uploaded list of models with best evaluations on the LLM leaderboard: • 50 items • Updated 17 days ago • 678

upvoted a paper over 2 years ago

Sparse Finetuning for Inference Acceleration of Large Language Models

Paper • 2310.06927 • Published Oct 10, 2023 • 15