v0.9.3

server: add support for flash attention v2
server: add support for llamav2

$npx -y @buildinternet/releases show rel_nfvv87ckc2OG0dU4rjZH5

Highlights

Full Changelog: https://github.com/huggingface/text-generation-inference/compare/v0.9.2...v0.9.3

Fetched April 7, 2026