Reconnaissance vocale NVIDIA Nemotron sur l'appareil
Nemotron est le nouveau moteur de reconnaissance vocale sur l'appareil de Hedy : entièrement local, plus précis qu'avant, et il identifie qui a dit quoi.
Deux problèmes accompagnent la transcription locale depuis longtemps. La précision restait derrière le cloud, et la transcription d’une conversation à plusieurs personnes revenait comme un seul bloc de texte indivisible, difficile à relire ensuite. Nemotron aide sur les deux points, et il s’exécute entièrement sur votre appareil.
Nemotron est le modèle de reconnaissance vocale sur l’appareil de NVIDIA. NVIDIA l’a publié en juin 2026, et Hedy fait partie des premières applications à l’intégrer dans un produit distribué plutôt que dans une démo. Il se trouve maintenant aux côtés de Whisper et Parakeet parmi les moteurs de reconnaissance vocale que vous pouvez choisir dans Hedy.
Un net progrès en précision locale
La transcription locale a toujours été le bon choix pour les personnes qui préfèrent garder leurs conversations sur leur propre matériel. Le compromis était la précision : les modèles sur l’appareil restaient derrière le cloud, parfois assez pour que cela se remarque. Nemotron réduit cet écart. Pour les réunions et appels du quotidien, la transcription qu’il produit est nettement meilleure que ce que les modèles locaux permettaient auparavant, sans que rien ne quitte votre appareil pour y parvenir.
Pour comprendre plus largement comment la transcription sur l’appareil s’intègre dans Hedy, consultez notre vue d’ensemble de l’IA locale pour les réunions et la plongée technique sur Hedy 3.2.
Il distingue vos locuteurs
Le changement le plus visible concerne l’apparence d’une transcription avec plusieurs personnes. Les anciennes transcriptions locales renvoyaient un mur de texte sans indiquer qui parlait. Nemotron sépare les locuteurs et les étiquette : Speaker 1, Speaker 2, Speaker 3, et ainsi de suite. Une réunion faite d’allers-retours se lit comme une vraie discussion.
L’endroit où ces étiquettes apparaissent dépend de votre plateforme :
- Sur iPhone et Mac, les étiquettes apparaissent en direct pendant que les gens parlent et que la conversation passe de l’un à l’autre.
- Sur Windows et Android, elles sont ajoutées à la fin de la session pendant le traitement, donc vous les verrez une fois votre transcription prête plutôt qu’en temps réel.
Deux versions : English Only et Multilingual
Nemotron existe en deux versions, et vous choisissez celle qui correspond à votre façon de travailler. La version English Only est réglée pour les conversations uniquement en anglais. La version Multilingual gère un large ensemble de langues à partir d’un seul modèle. C’est celle à choisir si vos réunions passent d’une langue à l’autre ou ne sont pas en anglais.
Vous trouverez les deux dans Settings, dans la section Speech & AI, à côté de Whisper. Changer de moteur prend quelques gestes. Pour une comparaison côte à côte de toutes les options, consultez notre comparaison des moteurs de reconnaissance vocale de Hedy.
Passer de Parakeet à Nemotron
Nemotron remplace Parakeet. Il fait le même travail en mieux, avec une transcription plus précise. Si vous utilisez Parakeet aujourd’hui, passez à Nemotron : Parakeet est en cours de retrait, et c’est avec Nemotron que ce travail continue. Whisper reste exactement à sa place comme moteur le plus largement compatible, et comme bon choix par défaut si vous utilisez un appareil plus ancien ou si vous le préférez simplement.
Ce qu’il vous faut pour l’utiliser
Sur iPhone et iPad, Nemotron nécessite un iPhone 12 ou plus récent, ou un iPad de cette génération ou ultérieur. Les anciens appareils Apple ne verront pas l’option. Il fonctionne aussi sur Mac, Windows et Android.
Ouvrez Settings → Speech & AI, choisissez Nemotron en version English Only ou Multilingual, et votre prochaine session sera transcrite sur votre appareil avec les locuteurs étiquetés. Plus facile à relire ensuite, sans que rien ne quitte votre appareil pour y parvenir.
About the author
Julian Pscheid is the founder and CEO of Hedy AI, a real-time AI meeting coach used by tens of thousands of professionals worldwide. He writes about how AI is changing the way people prepare for, capture, and understand important conversations.