Add LowVRAM option parameter (#642)

2025-02-17 16:10:16 +00:00 · 2023-06-20 20:33:47 +02:00 · 2023-06-20 20:33:47 +02:00 · 2f5feb4841
commit 2f5feb4841
parent 4e3c319e83
2 changed files with 5 additions and 0 deletions
--- a/api/config.go
+++ b/api/config.go
@ -35,6 +35,7 @@ type Config struct {
 	NGPULayers     int               `yaml:"gpu_layers"`
 	MMap           bool              `yaml:"mmap"`
 	MMlock         bool              `yaml:"mmlock"`
 	LowVRAM        bool              `yaml:"low_vram"`
 	TensorSplit           string `yaml:"tensor_split"`
 	MainGPU               string `yaml:"main_gpu"`
--- a/api/prediction.go
+++ b/api/prediction.go
@ -48,6 +48,10 @@ func defaultLLamaOpts(c Config) []llama.ModelOption {
 		llamaOpts = append(llamaOpts, llama.SetNBatch(512))
 	}
 	if c.LowVRAM {
 		llamaOpts = append(llamaOpts, llama.EnabelLowVRAM)
 	}
 	return llamaOpts
 }