3.35 MB

Ctrl+K

1 contributor

History: 2 commits

OpenTransformer

perf: optimized AVX2 kernel + COM6-inspired matmul dispatch (0.2 -> 3.43 t/s)

8f4b822 verified 6 days ago

amx
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
arch
perf: optimized AVX2 kernel + COM6-inspired matmul dispatch (0.2 -> 3.43 t/s) 6 days ago
cmake
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
kleidiai
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
llamafile
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
spacemit
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
CMakeLists.txt

32.8 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
arch-fallback.h

21 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
binary-ops.cpp

6.71 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
binary-ops.h

518 Bytes
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
common.h

2.33 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
ggml-cpu-impl.h

13.2 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
ggml-cpu.c

125 kB
perf: optimized AVX2 kernel + COM6-inspired matmul dispatch (0.2 -> 3.43 t/s) 6 days ago
ggml-cpu.cpp

24 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
hbm.cpp

2 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
hbm.h

155 Bytes
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
ops.cpp

372 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
ops.h

9.19 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
quants.c

43.2 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
quants.h

10.4 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
repack.cpp

151 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
repack.h

14.9 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
simd-gemm.h

3.77 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
simd-mappings.h

52.3 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
traits.cpp

1.23 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
traits.h

1.16 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
unary-ops.cpp

11.6 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
unary-ops.h

2.44 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
vec.cpp

25.3 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago
vec.h

66.6 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 6 days ago