Les modeles sont executes localement via llama.cpp.
Aucune donnee n'est transmise a un serveur externe — la confidentialite des inspections
est totalement preservee.
La performance depend du materiel disponible. Un GPU dedie avec Vulkan ou CUDA
accelere significativement le traitement de l'IA Vision (Qwen2-VL). Le fonctionnement
sur CPU seul reste possible pour Gemma 2B, mais avec un temps de reponse plus long.
Pour verifier l'integrite d'un fichier telecharge, utilisez la commande suivante dans PowerShell :
Get-FileHash .\gemma-2b-q8_0.gguf -Algorithm SHA256
Comparez le hash obtenu avec le SHA-256 affiche sur cette page.