Traitement IA local

Le traitement IA local exécute l’analyse IA de Hedy entièrement sur votre appareil. Vos transcriptions restent sur l’appareil et fonctionnent même hors ligne.

Cette fonctionnalité est disponible sur macOS (Apple Silicon), Windows (avec un GPU compatible Vulkan), iPhone 15 Pro et versions ultérieures, ainsi que sur les iPads avec une puce M-series ou A17 Pro. Avec cette option activée, les parties de Hedy qui lisent vos transcriptions et génèrent du texte — résumés, notes détaillées, invites rapides, réponses de chat, suggestions en session et retours — s’exécutent toutes localement plutôt que sur les serveurs de Hedy.

Le traitement IA local est optionnel et désactivé par défaut. La plupart des utilisateurs n’ont pas besoin de l’activer : l’IA cloud est toujours plus rapide et un cran au-dessus en qualité. Cette fonctionnalité est destinée aux personnes ayant des exigences de confidentialité que la configuration cloud ne peut pas satisfaire, ou qui souhaitent que Hedy fonctionne entièrement hors ligne.

Ce que fait le traitement IA local

Alimente les résumés de session, les notes détaillées, les invites rapides, les réponses de chat, les suggestions en session et les retours — tout sur votre appareil.
Conserve vos transcriptions sur l’appareil. Aucune donnée de conversation ne quitte votre appareil pour l’analyse IA.
Fonctionne hors ligne une fois le modèle téléchargé.
Coexiste avec la reconnaissance vocale cloud (Deepgram, OpenAI) si vous les utilisez. Seule l’étape d’analyse IA est locale.
Ne bascule pas silencieusement vers le cloud. En cas d’échec local, vous verrez un message d’erreur plutôt qu’une nouvelle tentative discrète sur nos serveurs — vous avez choisi le mode local pour une raison.

Prérequis

Macs Apple Silicon (M1 ou version ultérieure). Apple Silicon partage un seul pool de mémoire entre le CPU et le GPU, le modèle doit donc tenir dans votre RAM totale du système en plus de tout ce que vous exécutez par ailleurs. Les modèles les plus petits fonctionnent sur la plupart des Macs modernes. Les modèles de niveau intermédiaire (environ 9 milliards de paramètres) sont à l’aise sur les systèmes de 16 Go. Les modèles les plus grands peuvent nécessiter environ 25 Go de RAM pour se charger, donc 36 Go ou plus est réaliste pour ceux-là.

PC Windows avec un pilote Vulkan à jour. Ce qui compte le plus ici, c’est la VRAM de votre GPU, pas la RAM système. Les modèles plus grands nécessitent une carte graphique avec suffisamment de VRAM pour les contenir. Si un modèle est légèrement trop grand pour votre carte, Hedy déverse certaines couches sur le CPU — cela fonctionne mais est nettement plus lent, et le sélecteur de modèle marque ces entrées avec le suffixe « + Slow ».

iPhone 15 Pro et versions ultérieures, ainsi que les iPads avec une puce M-series ou A17 Pro. Limités aux modèles les plus petits en raison des contraintes mémoire des téléphones et tablettes. Les modèles compacts gèrent bien les résumés courts, mais leurs réponses sont nettement plus limitées que ce que vous obtiendriez avec un modèle plus grand sur un Mac.

Sur les plateformes natives qui ne peuvent pas encore exécuter l’IA sur l’appareil — Macs Intel, Android et iPhones et iPads plus anciens — la carte Traitement IA local apparaît tout de même dans Settings → Speech & AI, mais au lieu d’un bouton, elle affiche : « L’IA locale n’est pas encore disponible sur cet appareil. Nous travaillons à apporter l’IA sur l’appareil à davantage d’appareils. » Sur Windows sans GPU compatible Vulkan, la carte explique qu’une carte graphique compatible avec des pilotes à jour est nécessaire. (L’application web n’affiche aucune section IA locale.)

Android et Web sont sur notre feuille de route, mais pas encore pris en charge. La grande variété de matériel Android et les contraintes liées à l’exécution de modèles dans un navigateur rendent difficile une expérience cohérente aujourd’hui.

Vous aurez également besoin de mémoire libre adaptée au modèle que vous choisissez (Hedy affiche un indicateur de compatibilité sur chacun) et d’un téléchargement initial du modèle. La taille du modèle varie d’environ 2,5 Go à plus de 20 Go selon le modèle choisi.

Comment activer le traitement IA local

Ouvrez Hedy et accédez à Settings → Speech & AI.
Faites défiler jusqu’à la section Local AI Processing et activez-la.
Choisissez un modèle dans la liste qui correspond à la mémoire de votre appareil. Recherchez le label « Great fit ».
Attendez que le modèle finisse de se télécharger. Vous verrez la progression et la taille en Go.
Une fois téléchargé, le traitement IA local est actif. Démarrez une session normalement.

Le traitement IA local est configuré par appareil. Pour l’utiliser sur votre Mac et votre iPhone, activez-le et téléchargez un modèle sur chacun — le paramètre et les fichiers de modèle ne se transfèrent pas entre les appareils.

Choisir un modèle

Le sélecteur de modèle affiche plusieurs modèles avec une notation par étoiles basée sur leur taille :

★ (1 étoile) — Convient pour les résumés de réunion basiques et les notes courtes. Peut avoir des difficultés avec les longues réunions ou les questions de suivi nuancées. Plage de paramètres : 2 à 5 milliards.
★★ (2 étoiles) — Solide et polyvalent. Gère bien les résumés de réunion, les notes détaillées et le chat. Les conversations très longues ou très techniques peuvent être plus difficiles. Plage de paramètres : 8 à 10 milliards.
★★★ (3 étoiles) — Proche de notre IA cloud en qualité. Gère de façon fiable les longues réunions, les sujets vastes, les notes complexes et les questions de suivi élaborées. Plage de paramètres : 15 milliards et plus.

Hedy vérifie automatiquement la mémoire disponible sur votre appareil et signale chaque modèle :

Great fit — recommandé. Beaucoup de marge.
Tight fit — fonctionnera, mais peut être lent ou instable si vous utilisez de nombreuses autres applications.
Won’t fit — ne choisissez pas ce modèle.

Sur Windows, les modèles qui doivent déverser des couches sur le CPU affichent le suffixe « + Slow » pour que vous sachiez ce que vous choisissez.

En cas de doute, commencez par le modèle le plus grand affichant « Great fit » pour votre appareil. Vous pourrez en changer plus tard. Les modèles résident dans le stockage de votre application après le téléchargement, et vous pouvez en supprimer un à tout moment depuis le même écran pour récupérer de l’espace disque.

Passer du mode IA local au mode IA cloud

Désactivez le traitement IA local pour revenir à l’analyse cloud.
Vous ne perdez aucune session lors du changement. Les sessions existantes conservent leurs notes et résumés actuels.

Confidentialité

Lorsque le traitement IA local est activé, vos transcriptions et le contenu généré par IA (résumés, notes, réponses de chat, suggestions, retours) ne quittent jamais votre appareil pour l’analyse IA. Les téléchargements de modèles proviennent des serveurs de Hedy, mais ne contiennent aucune de vos données.

Ce qui transite vers nos serveurs dépend du fait que Cloud Sync soit également activé ou non :

IA locale activée, Cloud Sync désactivé. Rien concernant vos réunions ne quitte l’appareil. Les enregistrements audio, transcriptions, résumés, notes, réponses de chat et suggestions restent tous sur place.
IA locale activée, Cloud Sync activé. Le traitement IA s’effectue toujours entièrement sur votre appareil — vos transcriptions et le texte généré ne sont jamais envoyés pour traitement. Vos données de session se synchronisent quand même (chiffrées) sur les serveurs de Hedy afin que vous puissiez y accéder sur tous vos appareils, comme Cloud Sync l’a toujours fait.

Dans les deux cas, les informations de compte, les données d’utilisation et les rapports de plantage continuent de transiter par nos serveurs pour que l’application puisse fonctionner. Aucune de ces données ne contient du contenu de transcription ou des sorties générées par IA.

Pour la configuration la plus stricte, combinez le traitement IA local avec Cloud Sync désactivé — vos conversations n’existent alors que sur l’appareil qui les a capturées.

La reconnaissance vocale est une étape distincte. Si vous utilisez un fournisseur cloud comme Deepgram ou OpenAI pour la transcription, votre audio continue de transiter par ce fournisseur. Pour que les deux étapes restent locales, associez le traitement IA local à la reconnaissance vocale locale, comme Parakeet ou Whisper sur l’appareil. Consultez notre guide Fournisseurs de reconnaissance vocale.

Conseils pratiques

Désactivez Automatic Suggestions pour les longues sessions locales. Elles sollicitent en permanence le modèle local tout au long d’une session et peuvent ralentir tout le reste sur votre machine (et générer beaucoup de chaleur). Hedy vous en informe lorsque vous activez le traitement IA local pour la première fois.
Branchez votre ordinateur portable ou téléphone pour les longues sessions. L’inférence continue sur l’appareil décharge les batteries plus vite que prévu.
Choisissez un modèle qui tient confortablement dans votre matériel (RAM sur Mac et iOS, VRAM sur Windows). Un modèle « Tight fit » fonctionne, mais laisse moins de marge pour tout ce que vous faites par ailleurs.

Dépannage

Les réponses sont plus lentes que sur le cloud

C’est attendu. Un résumé qui semble instantané sur le cloud peut prendre entre 30 secondes et plusieurs minutes en local, selon votre matériel et le modèle choisi. Les modèles plus grands sont plus lents mais plus capables.

Le modèle ne se télécharge pas

Vérifiez votre connexion Internet et l’espace disque disponible.
Redémarrez Hedy et réessayez.
Certains modèles font plusieurs Go. Les téléchargements peuvent prendre du temps sur des connexions lentes.
Sur Windows, un logiciel antivirus peut interrompre les téléchargements volumineux ou mettre en quarantaine les fichiers de modèle. Consultez L’antivirus Windows bloque le téléchargement ou l’installation de Hedy si cela se produit.

Les réponses sont très lentes ou l’application semble ne plus répondre

Comparez les exigences en RAM/VRAM du modèle avec votre mémoire libre. Un modèle « Tight fit » en concurrence avec d’autres applications peut fonctionner lentement.
Fermez les applications gourmandes en mémoire que vous n’utilisez pas (onglets de navigateur supplémentaires, applications en arrière-plan).
Essayez un modèle plus petit.
Sur Windows, vérifiez que votre pilote GPU est à jour. Consultez Corriger la transcription lente sur Windows (paramètres GPU) pour obtenir des conseils sur les pilotes — ces recommandations s’appliquent également à l’IA locale.

« Le modèle d’IA locale n’est pas prêt » au démarrage d’une session, d’une importation ou d’une fusion

Cela signifie que le Traitement IA local est sélectionné, mais qu’aucun modèle n’est encore téléchargé. Hedy n’a donc aucun moteur pour générer du contenu IA. Ouvrez Settings → Speech & AI pour télécharger un modèle, ou revenez à l’IA cloud pour continuer immédiatement. Hedy l’affiche maintenant avant le démarrage de la session au lieu d’échouer silencieusement en cours de route.

« L’IA locale a perdu l’accès à votre modèle »

Hedy ne peut plus accéder à un modèle que vous aviez ajouté auparavant — généralement parce que le fichier a été déplacé ou supprimé en dehors de l’application. Ouvrez Settings → Speech & AI, supprimez ce modèle, puis ajoutez-le à nouveau.

Les fonctionnalités IA indiquent « non disponible »

Confirmez que le modèle a fini de se télécharger (vérifiez la section Traitement IA local dans les paramètres). Un modèle dont le téléchargement a été interrompu n’apparaît plus comme « Téléchargé » — retéléchargez-le si c’est le cas.
Désactivez puis réactivez le traitement IA local.

Retours

Faire tourner l’IA entièrement sur votre appareil est une technologie de pointe, et nous en sommes encore aux débuts. Les modèles locaux sont plus petits que les modèles cloud, donc les réponses peuvent être moins précises ou détaillées, et sur certains systèmes vous pouvez rencontrer de l’instabilité ou des démarrages lents. Ces compromis se réduiront à mesure que l’IA locale mûrira, et nous continuerons à étendre la prise en charge à davantage de plateformes au fur et à mesure que la technologie le permettra.

Envoyez un e-mail à support@hedy.ai pour tout retour ou signalement de problème.

En rapport : Contrôle de la confidentialité de l’analyse IA cloud, Fournisseurs de reconnaissance vocale.