GitHub / France-Travail / vllm-ft
A high-throughput and memory-efficient inference and serving engine for LLMs
JSON API: https://data.code.gouv.fr/api/v1/hosts/GitHub/repositories/France-Travail%2Fvllm-ft
étoiles: 4
forks: 0
issues ouvertes: 1
licence: apache-2.0
langage: Python
taille: 56,4 Mo
dépendances analysées: En attente
date de création: il y a 5 mois
date de mise à jour: il y a 24 jours
enregistré: il y a 24 jours
dernière synchronisation: il y a environ 22 heures
Funding Links https://github.com/sponsors/vllm-project, https://opencollective.com/vllm