Just published: Nano-vLLM meets Inference Endpoints

I show how to bind Nano-vLLM (supporting Qwen3-0.6B) to a web service — and deploy it easily on Hugging Face Inference Endpoints.

Minimalist engine, maximum fun!

https://huggingface.co/blog/angt/nano-vllm-meets-inference-endpoints

commented on Nano-vLLM meets Inference Endpoints 5 months ago

liked 2 Spaces about 3 years ago

Specification-induced correlations

💻

Evaluate gender pronoun predictions in text using BERT models

Spurious_correlation_evaluation

💻

Muawiz Chaudhary

AI & ML interests

Recent Activity

Organizations

MuawizC's activity

DLLM Demo

Specification-induced correlations

Spurious_correlation_evaluation