LocalAI

mirror of https://github.com/mudler/LocalAI.git synced 2025-03-25 13:27:43 +00:00

Author	SHA1	Message	Date
Ettore Di Giacinto	1770b92fb6	chore(api): return values from schema (#4153 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-14 14:12:29 +01:00
Ettore Di Giacinto	6daef00d30	chore(refactor): drop unnecessary code in loader (#4096 ) * chore: simplify passing options to ModelOptions Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(refactor): do not expose internal backend Loader Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-08 21:54:25 +01:00
Ettore Di Giacinto	e2a8dd64db	fix(tts): correctly pass backend config when generating model options (#4091 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-07 18:30:22 +01:00
Ettore Di Giacinto	20a5b20b59	chore(p2p): enhance logging (#4090 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-07 18:09:33 +01:00
Ettore Di Giacinto	2c041a2077	feat(ui): move model detailed info to a modal (#4086 ) * feat(ui): move model detailed info to a modal Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore: add static asset Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-06 18:25:59 +01:00
Ettore Di Giacinto	b425a870b0	fix(diffusers): correctly parse height and width request without parametrization (#4082 ) * fix(diffusers): allow to specify width and height without enable-parameters Let's simplify usage by not gating width and height by parameters Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore: use sane defaults Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-06 08:53:02 +01:00
Ettore Di Giacinto	947224b952	feat(diffusers): allow multiple lora adapters (#4081 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-05 15:14:33 +01:00
Arnaud A	65c3df392c	feat(tts): Implement naive response_format for tts endpoint (#4035 ) Signed-off-by: n-Arno <arnaud.alcabas@gmail.com>	2024-11-02 19:13:35 +00:00
Ettore Di Giacinto	8f7045cfa6	chore(tests): bump timeouts (#4024 ) To avoid flaky runs Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-10-31 15:40:43 +01:00
Ettore Di Giacinto	88edb1e2af	chore(tests): expand timeout (#4019 ) Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-10-30 15:34:44 +01:00
Ettore Di Giacinto	546dce68a6	chore: change url to github repository (#3972 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-26 14:50:18 +02:00
Ettore Di Giacinto	ae1ec4e096	feat(vllm): expose 'load_format' (#3943 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-23 15:34:57 +02:00
Ettore Di Giacinto	8737a65760	feat: allow to disable '/metrics' endpoints for local stats (#3945 ) Seem the "/metrics" endpoint that is source of confusion as people tends to believe we collect telemetry data just because we import "opentelemetry", however it is still a good idea to allow to disable even local metrics if not really required. See also: https://github.com/mudler/LocalAI/issues/3942 Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-23 15:34:32 +02:00
Ettore Di Giacinto	ccc7cb0287	feat(templates): use a single template for multimodals messages (#3892 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-22 09:34:05 +02:00
Ettore Di Giacinto	d5da8c3509	feat(templates): extract text from multimodal requests (#3866 ) When offloading template construction to the backend, we want to keep text around in case of multimodal requests. Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-17 17:33:50 +02:00
Dave	a1634b219a	fix: roll out bluemonday Sanitize more widely (#3794 ) * initial pass: roll out bluemonday sanitization more widely Signed-off-by: Dave Lee <dave@gray101.com> * add one additional sanitize - the overall modelslist used by the docs site Signed-off-by: Dave Lee <dave@gray101.com> --------- Signed-off-by: Dave Lee <dave@gray101.com>	2024-10-12 09:45:47 +02:00
Dave	65ca754166	Fix: listmodelservice / welcome endpoint use LOOSE_ONLY (#3791 ) * fix list model service and welcome Signed-off-by: Dave Lee <dave@gray101.com> * comment Signed-off-by: Dave Lee <dave@gray101.com> --------- Signed-off-by: Dave Lee <dave@gray101.com>	2024-10-11 23:49:00 +02:00
Ettore Di Giacinto	a0f0505f0d	fix(welcome): do not list model twice if we have a config (#3790 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-11 17:30:14 +02:00
Ettore Di Giacinto	d9b63fae7c	chore(tests): improve rwkv tests and consume TEST_FLAKES (#3765 ) chores(tests): improve rwkv tests and consume TEST_FLAKES consistently use TEST_FLAKES and reduce flakiness of rwkv tests by being case insensitive Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-08 09:24:19 +02:00
Ettore Di Giacinto	648ffdf449	feat(multimodal): allow to template placeholders (#3728 ) feat(multimodal): allow to template image placeholders Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-04 18:32:29 +02:00
Ettore Di Giacinto	d06a052d54	chore(federated): display a message when nodes are not available (#3721 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-03 18:38:41 +02:00
Ettore Di Giacinto	e5586e8781	chore: get model also from query (#3716 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-02 20:20:50 +02:00
Ettore Di Giacinto	3acd767ac4	chore: simplify model loading (#3715 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-10-02 08:59:06 +02:00
Shraddha	5488fc3bc1	feat: tokenization endpoint (#3710 ) endpoint to access the tokenizer Signed-off-by: shraddhazpy <shraddha@shraddhafive.in> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com> Co-authored-by: Dave <dave@gray101.com>	2024-10-02 08:56:18 +02:00
Ettore Di Giacinto	0965c6cd68	feat: track internally started models by ID (#3693 ) * chore(refactor): track internally started models by ID Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Just extend options, no need to copy Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Improve debugging for rerankers failures Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Simplify model loading with rerankers Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Be more consistent when generating model options Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Uncommitted code Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Make deleteProcess more idiomatic Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Adapt CLI for sound generation Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixup threads definition Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Handle corner case where c.Seed is nil Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Consistently use ModelOptions Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Adapt new code to refactoring Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io> Co-authored-by: Dave <dave@gray101.com>	2024-10-02 08:55:58 +02:00
Dave	307a835199	groundwork: ListModels Filtering Upgrade (#2773 ) * seperate the filtering from the middleware changes --------- Signed-off-by: Dave Lee <dave@gray101.com>	2024-10-01 18:55:46 +00:00
siddimore	f84b55d1ef	feat: Add Get Token Metrics to GRPC server (#3687 ) * Add Get Token Metrics to GRPC server Signed-off-by: Siddharth More <siddimore@gmail.com> * Expose LocalAI endpoint Signed-off-by: Siddharth More <siddimore@gmail.com> --------- Signed-off-by: Siddharth More <siddimore@gmail.com>	2024-10-01 14:41:20 +02:00
siddimore	50a3b54e34	feat(api): add correlationID to Track Chat requests (#3668 ) * Add CorrelationID to chat request Signed-off-by: Siddharth More <siddimore@gmail.com> * remove get_token_metrics Signed-off-by: Siddharth More <siddimore@gmail.com> * Add CorrelationID to proto Signed-off-by: Siddharth More <siddimore@gmail.com> * fix correlation method name Signed-off-by: Siddharth More <siddimore@gmail.com> * Update core/http/endpoints/openai/chat.go Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com> Signed-off-by: Siddharth More <siddimore@gmail.com> * Update core/http/endpoints/openai/chat.go Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com> Signed-off-by: Siddharth More <siddimore@gmail.com> --------- Signed-off-by: Siddharth More <siddimore@gmail.com> Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-09-28 17:23:56 +02:00
Ettore Di Giacinto	a3d69872e3	feat(api): list loaded models in `/system` (#3661 ) feat(api): list loaded models in /system Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-09-25 18:00:23 +02:00
Ettore Di Giacinto	0893d3cbbe	fix(health): do not require auth for /healthz and /readyz (#3656 ) * fix(health): do not require auth for /healthz and /readyz Fixes: #3655 Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Comment so I don’t forget Adding a reminder here... --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io> Co-authored-by: Dave <dave@gray101.com>	2024-09-24 18:25:59 +00:00
Dave	90cacb9692	test: preliminary tests and merge fix for authv2 (#3584 ) * add api key to existing app tests, add preliminary auth test Signed-off-by: Dave Lee <dave@gray101.com> * small fix, run test Signed-off-by: Dave Lee <dave@gray101.com> * status on non-opaque Signed-off-by: Dave Lee <dave@gray101.com> * tweak auth error Signed-off-by: Dave Lee <dave@gray101.com> * exp Signed-off-by: Dave Lee <dave@gray101.com> * quick fix on real laptop Signed-off-by: Dave Lee <dave@gray101.com> * add downloader version that allows providing an auth header Signed-off-by: Dave Lee <dave@gray101.com> * stash some devcontainer fixes during testing Signed-off-by: Dave Lee <dave@gray101.com> * s2 Signed-off-by: Dave Lee <dave@gray101.com> * s Signed-off-by: Dave Lee <dave@gray101.com> * done with experiment Signed-off-by: Dave Lee <dave@gray101.com> * done with experiment Signed-off-by: Dave Lee <dave@gray101.com> * after merge fix Signed-off-by: Dave Lee <dave@gray101.com> * rename and fix Signed-off-by: Dave Lee <dave@gray101.com> --------- Signed-off-by: Dave Lee <dave@gray101.com> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-09-24 09:32:48 +02:00
Sertaç Özercan	ee21b00a8d	feat: auto load into memory on startup (#3627 ) Signed-off-by: Sertac Ozercan <sozercan@gmail.com>	2024-09-22 10:03:30 +02:00
Ettore Di Giacinto	191bc2e50a	feat(api): allow to pass audios to backends (#3603 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-09-19 12:26:53 +02:00
Ettore Di Giacinto	fbb9facda4	feat(api): allow to pass videos to backends (#3601 ) This prepares the API to receive videos as well for video understanding. It works similarly to images, where the request should be in the form: { "type": "video_url", "video_url": { "url": "url or base64 data" } } Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-09-19 11:21:59 +02:00
Ettore Di Giacinto	a53392f919	chore(refactor): drop duplicated shutdown logics (#3589 ) * chore(refactor): drop duplicated shutdown logics - Handle locking in Shutdown and CheckModelIsLoaded in a more go-idiomatic way - Drop duplicated code and re-organize shutdown code Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix: drop leftover Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore: improve logging and add missing locks Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-09-17 16:51:40 +02:00
Dave	db1159b651	feat: auth v2 - supersedes #2894 (#3476 ) feat: auth v2 - supercedes #2894, metrics to follow later Signed-off-by: Dave Lee <dave@gray101.com>	2024-09-16 23:29:07 -04:00
Ettore Di Giacinto	cf747bcdec	feat: extract output with regexes from LLMs (#3491 ) * feat: extract output with regexes from LLMs This changset adds `extract_regex` to the LLM config. It is a list of regexes that can match output and will be used to re extract text from the LLM output. This is particularly useful for LLMs which outputs final results into tags. Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add tests, enhance output in case of configuration error Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-09-13 13:27:36 +02:00
Dave	300f2779e4	fix: speedup and improve cachability of docker build of `builder-sd` (#3430 ) fix: speedup and improve cachability of docker build of `builder-sd` (#3430) --------- Signed-off-by: Dave Lee <dave@gray101.com>	2024-09-10 08:57:16 +02:00
Ettore Di Giacinto	791c3ace72	feat: add endpoint to list system informations (#3449 ) * feat: add endpoint to list system informations For now, it lists the available backends, but can be expanded later on to include more system informations (such as GPU devices detected, RAM, threads configured, and so on so forth). Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * show also external backends Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * add test Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-09-05 20:44:30 +02:00
Dave	c2804c42fe	fix: untangle pkg/grpc and core/schema for Transcription (#3419 ) untangle pkg/grpc and core/schema in Transcribe Signed-off-by: Dave Lee <dave@gray101.com>	2024-09-02 15:48:53 +02:00
Ettore Di Giacinto	11d960b2a6	chore(cli): be consistent between workers and expose ExtraLLamaCPPArgs to both (#3428 ) * chore(cli): be consistent between workers and expose ExtraLLamaCPPArgs to both Fixes: https://github.com/mudler/LocalAI/issues/3427 Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * bump grpcio Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-30 00:10:17 +02:00
Ettore Di Giacinto	da3bc8077d	fix(tts): check error before inspecting result (#3415 ) Otherwise we panic when a res is nil Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-27 17:35:16 +02:00
Ettore Di Giacinto	7f06954425	fix(model-loading): keep track of open GRPC Clients (#3377 ) Due to a previous refactor we moved the client constructor tight to the model address, however that was just a string which we would use to build the client each time. With this change we make the loader to return a *Model which carries a constructor for the client and stores the client on the first connection. Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-25 14:36:09 +02:00
Ettore Di Giacinto	ce827139bb	fix(p2p): correctly allow to pass extra args to llama.cpp (#3368 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-24 10:30:24 +02:00
Dave	81ae92f017	feat: elevenlabs `sound-generation` api (#3355 ) * initial version of elevenlabs compatible soundgeneration api and cli command Signed-off-by: Dave Lee <dave@gray101.com> * minor cleanup Signed-off-by: Dave Lee <dave@gray101.com> * restore TTS, add test Signed-off-by: Dave Lee <dave@gray101.com> * remove stray s Signed-off-by: Dave Lee <dave@gray101.com> * fix Signed-off-by: Dave Lee <dave@gray101.com> --------- Signed-off-by: Dave Lee <dave@gray101.com> Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-08-24 00:20:28 +00:00
Ettore Di Giacinto	fbaae8528d	fix(chat): re-generated uuid, created, and text on each request (#3359 ) This was noticed by models returning content besides function calls. Sadly we can't test that easily in the CI so it got unnoticed. Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-22 10:56:05 +02:00
Ettore Di Giacinto	023ce59d44	feat(p2p): allow to set intervals (#3353 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-21 18:23:51 +02:00
Ettore Di Giacinto	7822d944b5	chore(p2p): single-node when sharing federated instance (#3354 ) * chore(p2p): single-node when sharing federated instance Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore: refactor out and extract into functions Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-21 18:23:42 +02:00
Ettore Di Giacinto	b510352393	chore(anime.js): drop unused (#3351 ) * fix(anime.js): correctly set the static path Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Drop anime.js (unused) Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-21 13:10:09 +02:00
Ettore Di Giacinto	af095204fa	fix(p2p): avoid starting the node twice (#3349 ) * fix(p2p): avoid starting the node twice Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix(p2p): keep exposing service if we don't start the llama.cpp runner Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-21 10:30:56 +02:00

1 2 3 4 5

222 Commits