OpenTransformer
/

llama.cpp-prismml

Model card Files Files and versions

llama.cpp-prismml / ggml /src /ggml-cpu /arch

1.76 MB

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

OpenTransformer's picture

OpenTransformer

perf: optimized AVX2 kernel + COM6-inspired matmul dispatch (0.2 -> 3.43 t/s)

8f4b822 verified 9 days ago