whisper.cpp

mirror of https://github.com/ggerganov/whisper.cpp.git synced 2025-05-09 20:13:14 +00:00

History

Rémy O 3bab804981 vulkan: add specific MMV kernels for IQ2 and IQ3 quants + optimizations (llama/11595)

* vulkan: implement specialized MMV kernels for IQ2 quantizations

* vulkan: add MMV kernels for IQ3 quants

* vulkan: Increase MMV batch size and unroll IQ LUT setup

* vulkan: fix init_iq_shmem for WG sizes larger than tables

* vulkan: common batch size for all I-quants

2025-03-08 15:13:01 +02:00

cmake

fix: ggml: fix vulkan-shaders-gen build (llama/10448)

2025-02-03 22:00:57 +02:00

vulkan-shaders

vulkan: add specific MMV kernels for IQ2 and IQ3 quants + optimizations (llama/11595)

2025-03-08 15:13:01 +02:00

CMakeLists.txt

fix: ggml: fix vulkan-shaders-gen build (llama/10448)

2025-02-03 22:00:57 +02:00

ggml-vulkan.cpp

vulkan: add specific MMV kernels for IQ2 and IQ3 quants + optimizations (llama/11595)

2025-03-08 15:13:01 +02:00