LocalAI

mirror of https://github.com/mudler/LocalAI.git synced 2025-05-31 14:30:45 +00:00

Author	SHA1	Message	Date
Ettore Di Giacinto	30e3c47598	Improve audio detection Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	90206830c1	WIP - to drop Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	7592984b64	Use template evaluator for preparing LLM prompt in wrapped mode Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	c526f05de5	Small adaptations Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	06e438d68b	WIP Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	3dd1b300e9	wip Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	ebfe8dd119	gRPC client stubs Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	136fbd25f5	wip(vad) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	59531562a6	Fix lock handling Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	9273395e38	Move to debug calls Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	0318434b17	Attach context for VAD Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	9614422713	chore(vad): try to hook vad to received data from the API (WIP) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	a3fd8caaa6	feat(vad): hook vad detection Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	1796a1713d	chore: extract realtime models into two categories One is anyToAny models that requires a VAD model, and one is wrappedModel that requires as well VAD models along others in the pipeline. Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	4f69170273	feat: correctly detect when starting the vad server Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	60c99ddc50	refactor Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	b4fea58076	Load wrapper clients Testing with: ```yaml name: gpt-4o pipeline: tts: voice-it-riccardo_fasol-x-low transcription: whisper-base-q5_1 llm: llama-3.2-1b-instruct:q4_k_m ``` Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	9e965033bb	chore: simplify passing options to ModelOptions Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	05225c93e4	Fix route Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	65f4c12d1e	setup ws upgrade Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	f45d11c734	Add model interface to sessions Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	4ca7689f31	debug Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	dcb13a7e6f	WIP Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Ettore Di Giacinto	8f507c39c0	WIP Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-14 17:13:58 +01:00
Max Goltzsche	8cc2d01caa	feat(ui): path prefix support via HTTP header (#4497 ) Makes the web app honour the `X-Forwarded-Prefix` HTTP request header that may be sent by a reverse-proxy in order to inform the app that its public routes contain a path prefix. For instance this allows to serve the webapp via a reverse-proxy/ingress controller under a path prefix/sub path such as e.g. `/localai/` while still being able to use the regular LocalAI routes/paths without prefix when directly connecting to the LocalAI server. Changes: * Add new `StripPathPrefix` middleware to strip the path prefix (provided with the `X-Forwarded-Prefix` HTTP request header) from the request path prior to matching the HTTP route. * Add a `BaseURL` utility function to build the base URL, honouring the `X-Forwarded-Prefix` HTTP request header. * Generate the derived base URL into the HTML (`head.html` template) as `<base/>` tag. * Make all webapp-internal URLs (within HTML+JS) relative in order to make the browser resolve them against the `<base/>` URL specified within each HTML page's header. * Make font URLs within the CSS files relative to the CSS file. * Generate redirect location URLs using the new `BaseURL` function. * Use the new `BaseURL` function to generate absolute URLs within gallery JSON responses. Closes #3095 TL;DR: The header-based approach allows to move the path prefix configuration concern completely to the reverse-proxy/ingress as opposed to having to align the path prefix configuration between LocalAI, the reverse-proxy and potentially other internal LocalAI clients. The gofiber swagger handler already supports path prefixes this way, see `e2d9e9916d/swagger.go (L79)` Signed-off-by: Max Goltzsche <max.goltzsche@gmail.com>	2025-01-07 17:18:21 +01:00
Ettore Di Giacinto	24abf568cb	chore(tests): stabilize tts test (#4417 ) chore(tests): stabilize test Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-12-17 00:46:48 +01:00
Ettore Di Giacinto	f943c4b803	Revert "feat: include tokens usage for streamed output" (#4336 ) Revert "feat: include tokens usage for streamed output (#4282)" This reverts commit 0d6c3a7d57101428aec4100d0f7bca765ee684a7.	2024-12-08 17:53:36 +01:00
Ettore Di Giacinto	cea5a0ea42	feat(template): read jinja templates from gguf files (#4332 ) * Read jinja templates as fallback Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Move templating out of model loader Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Test TemplateMessages Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Set role and content from transformers Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Tests: be more flexible Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * More jinja Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Small refactoring and adaptations Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-12-08 13:50:33 +01:00
Ettore Di Giacinto	58ff47de26	feat(bark-cpp): add new bark.cpp backend (#4287 ) * feat(bark-cpp): add new bark.cpp backend Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * build on linux only for now Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * track bark.cpp in CI bumps Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Drop old entries from bumper Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * No need to test rwkv specifically, now part of llama.cpp Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-28 22:16:44 +01:00
mintyleaf	0d6c3a7d57	feat: include tokens usage for streamed output (#4282 ) Use pb.Reply instead of []byte with Reply.GetMessage() in llama grpc to get the proper usage data in reply streaming mode at the last [DONE] frame Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-11-28 14:47:56 +01:00
Ettore Di Giacinto	3c3050f68e	feat(backends): Drop bert.cpp (#4272 ) * feat(backends): Drop bert.cpp use llama.cpp 3.2 as a drop-in replacement for bert.cpp Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(tests): make test more robust Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-27 16:34:28 +01:00
Ettore Di Giacinto	4f1ab2366d	chore(refactor): imply modelpath (#4208 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-20 18:06:35 +01:00
Ettore Di Giacinto	b1ea9318e6	feat(silero): add Silero-vad backend (#4204 ) * feat(vad): add silero-vad backend (WIP) Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * feat(vad): add API endpoint Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix(vad): correctly place the onnxruntime libs Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(vad): hook silero-vad to binary and container builds Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * feat(gRPC): register VAD Server Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix(Makefile): consume ONNX_OS consistently Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix(Makefile): handle macOS Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io> Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-11-20 14:48:40 +01:00
mintyleaf	de148cb2ad	feat: add WebUI API token authorization (#4197 ) * return 401 instead of 403, provide www-authenticate header, redirect to the login page, add cookie token support * set cookies completely through js in auth page	2024-11-19 18:43:02 +01:00
Ettore Di Giacinto	1770b92fb6	chore(api): return values from schema (#4153 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-14 14:12:29 +01:00
Ettore Di Giacinto	2c041a2077	feat(ui): move model detailed info to a modal (#4086 ) * feat(ui): move model detailed info to a modal Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore: add static asset Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-06 18:25:59 +01:00
Ettore Di Giacinto	b425a870b0	fix(diffusers): correctly parse height and width request without parametrization (#4082 ) * fix(diffusers): allow to specify width and height without enable-parameters Let's simplify usage by not gating width and height by parameters Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore: use sane defaults Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-06 08:53:02 +01:00
Arnaud A	65c3df392c	feat(tts): Implement naive response_format for tts endpoint (#4035 ) Signed-off-by: n-Arno <arnaud.alcabas@gmail.com>	2024-11-02 19:13:35 +00:00
Ettore Di Giacinto	8f7045cfa6	chore(tests): bump timeouts (#4024 ) To avoid flaky runs Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-10-31 15:40:43 +01:00
Ettore Di Giacinto	88edb1e2af	chore(tests): expand timeout (#4019 ) Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-10-30 15:34:44 +01:00
Ettore Di Giacinto	546dce68a6	chore: change url to github repository (#3972 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-26 14:50:18 +02:00
Ettore Di Giacinto	8737a65760	feat: allow to disable '/metrics' endpoints for local stats (#3945 ) Seem the "/metrics" endpoint that is source of confusion as people tends to believe we collect telemetry data just because we import "opentelemetry", however it is still a good idea to allow to disable even local metrics if not really required. See also: https://github.com/mudler/LocalAI/issues/3942 Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-23 15:34:32 +02:00
Ettore Di Giacinto	ccc7cb0287	feat(templates): use a single template for multimodals messages (#3892 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-22 09:34:05 +02:00
Dave	a1634b219a	fix: roll out bluemonday Sanitize more widely (#3794 ) * initial pass: roll out bluemonday sanitization more widely Signed-off-by: Dave Lee <dave@gray101.com> * add one additional sanitize - the overall modelslist used by the docs site Signed-off-by: Dave Lee <dave@gray101.com> --------- Signed-off-by: Dave Lee <dave@gray101.com>	2024-10-12 09:45:47 +02:00
Dave	65ca754166	Fix: listmodelservice / welcome endpoint use LOOSE_ONLY (#3791 ) * fix list model service and welcome Signed-off-by: Dave Lee <dave@gray101.com> * comment Signed-off-by: Dave Lee <dave@gray101.com> --------- Signed-off-by: Dave Lee <dave@gray101.com>	2024-10-11 23:49:00 +02:00
Ettore Di Giacinto	a0f0505f0d	fix(welcome): do not list model twice if we have a config (#3790 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-11 17:30:14 +02:00
Ettore Di Giacinto	d9b63fae7c	chore(tests): improve rwkv tests and consume TEST_FLAKES (#3765 ) chores(tests): improve rwkv tests and consume TEST_FLAKES consistently use TEST_FLAKES and reduce flakiness of rwkv tests by being case insensitive Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-08 09:24:19 +02:00
Ettore Di Giacinto	648ffdf449	feat(multimodal): allow to template placeholders (#3728 ) feat(multimodal): allow to template image placeholders Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-04 18:32:29 +02:00
Ettore Di Giacinto	e5586e8781	chore: get model also from query (#3716 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-02 20:20:50 +02:00
Shraddha	5488fc3bc1	feat: tokenization endpoint (#3710 ) endpoint to access the tokenizer Signed-off-by: shraddhazpy <shraddha@shraddhafive.in> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com> Co-authored-by: Dave <dave@gray101.com>	2024-10-02 08:56:18 +02:00

1 2 3 4

175 Commits