LocalAI

mirror of https://github.com/mudler/LocalAI.git synced 2025-05-21 17:58:02 +00:00

History

feat: Token Stream support for Transformer, fix: missing package for OpenVINO (#1908 )

* Streaming working

* Small fix for regression on CUDA and XPU

* use pip version of optimum[openvino]

* Update backend/python/transformers/transformers_server.py

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

* Token streaming support

fix optimum[openvino] package in install.sh

* Token Streaming support

---------

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

2024-03-27 17:50:35 +01:00

install.sh

feat: Token Stream support for Transformer, fix: missing package for OpenVINO (#1908 )

2024-03-27 17:50:35 +01:00

Makefile

feat(intel): add diffusers/transformers support (#1746 )

2024-03-07 14:37:45 +01:00

transformers-nvidia.yml

fix: downgrade torch (#1902 )

2024-03-26 22:56:02 +01:00

transformers-rocm.yml

Enhance autogptq backend to support VL models (#1860 )

2024-03-26 18:48:14 +01:00

transformers.yml

feat: Openvino runtime for transformer backend and streaming support for Openvino and CUDA (#1892 )

2024-03-26 23:31:43 +00:00