whisper.cpp

mirror of https://github.com/ggerganov/whisper.cpp.git synced 2025-06-23 16:57:42 +00:00

Files

Johannes Gäßler e4bc83ab47 CUDA: refactor and optimize IQ MMVQ (llama/8215)

* CUDA: refactor and optimize IQ MMVQ

* uint -> uint32_t

* __dp4a -> ggml_cuda_dp4a

* remove MIN_CC_DP4A checks

* change default

* try CI fix

2024-07-08 14:53:55 +03:00

2024-06-26 19:34:09 +03:00

2024-06-26 19:34:09 +03:00

2024-07-08 14:53:55 +03:00

.gitignore

2024-06-26 19:34:09 +03:00

CMakeLists.txt

2024-06-26 23:18:11 +03:00

ggml_vk_generate_shaders.py

2024-06-26 19:34:09 +03:00