Krishna Teja Chitty-Venkata's picture

Building on HF

4

Krishna Teja Chitty-Venkata

krishnateja95

RedHatAI

·

https://krishnateja95.github.io/

AI & ML interests

LLM Optimization, Neural Architecture Search, Quantization, Pruning

Recent Activity

updated a model about 7 hours ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6bits

published a model about 7 hours ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6bits

updated a model about 1 month ago

inference-optimization/Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_6.5-bits

View all activity

Organizations

updated a model about 7 hours ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6bits

23B • Updated about 7 hours ago

published a model about 7 hours ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6bits

23B • Updated about 7 hours ago

updated 7 models about 1 month ago

inference-optimization/Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_6.5-bits

7B • Updated about 1 month ago • 1

inference-optimization/Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_6.25-bits

6B • Updated about 1 month ago • 4

inference-optimization/Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_6.0-bits

6B • Updated about 1 month ago

inference-optimization/Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_5.75-bits

6B • Updated about 1 month ago • 3

inference-optimization/Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_5.5-bits

6B • Updated about 1 month ago

inference-optimization/Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_5.25-bits

6B • Updated about 1 month ago • 1

inference-optimization/Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_5.0-bits

5B • Updated about 1 month ago • 3

updated a collection about 1 month ago

Mixed Precision Models

Collection of Mixed Precision LLaMA and Qwen Models • 7 items • Updated about 1 month ago

published a model about 1 month ago

inference-optimization/Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_6.5-bits

7B • Updated about 1 month ago • 1

updated a collection about 1 month ago

Mixed Precision Models

Collection of Mixed Precision LLaMA and Qwen Models • 7 items • Updated about 1 month ago

published a model about 1 month ago

inference-optimization/Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_6.25-bits

6B • Updated about 1 month ago • 4

updated a collection about 1 month ago

Mixed Precision Models

Collection of Mixed Precision LLaMA and Qwen Models • 7 items • Updated about 1 month ago

published 2 models about 1 month ago

inference-optimization/Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_6.0-bits

6B • Updated about 1 month ago

inference-optimization/Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_5.75-bits

6B • Updated about 1 month ago • 3

updated a collection about 1 month ago

Mixed Precision Models

Collection of Mixed Precision LLaMA and Qwen Models • 7 items • Updated about 1 month ago

published a model about 1 month ago

inference-optimization/Meta-Llama-3.1-8B-Instruct-NVFP4-FP8-Dynamic_5.5-bits

6B • Updated about 1 month ago

updated a collection about 1 month ago

Mixed Precision Models

Collection of Mixed Precision LLaMA and Qwen Models • 7 items • Updated about 1 month ago