Spracherkennungsanbieter in Hedy
Was sind Spracherkennungsanbieter?
Hedy unterstutzt mehrere Spracherkennungsoptionen und bietet Ihnen die Flexibilitat, zwischen vollstandiger Privatsphare durch lokale Verarbeitung und cloudbasierten Alternativen zu wahlen. Sie konnen jederzeit zwischen Anbietern wechseln — nutzen Sie die lokale Verarbeitung fur Offline-Sitzungen und Cloud-Dienste, wenn Sie deren spezifische Funktionen bevorzugen.
Erste Schritte
-
Offnen Sie die Hedy-App
-
Navigieren Sie zu den Einstellungen (tippen Sie auf Ihr Profilsymbol)
-
Scrollen Sie zu “Speech Recognition Options”
-
Wahlen Sie Ihren bevorzugten Anbieter aus dem Dropdown-Menu
-
Konfigurieren Sie bei Bedarf anbieterspezifische Einstellungen
-
Ihre Auswahl wird in der nachsten Aufnahmesitzung wirksam
Verfugbare Anbieter
Hedy bietet drei Spracherkennungsoptionen, jede mit eigenen Merkmalen:
-
Local Speech Recognition: Standardoption — 100 % privat, funktioniert offline, keine Nutzungskosten. Ihre Audiodaten verlassen niemals Ihr Gerat.
-
Deepgram: Cloudbasierter Dienst mit Echtzeit-Streaming und intelligenten Formatierungsfunktionen. Verwendet Nova-3, das Dutzende von Sprachen unterstützt. Hedy stellt jede von Nova-3 unterstützte Sprache bereit, sodass Sie Meetings in jeder unterstützten Sprache transkribieren können, ohne den Anbieter zu wechseln. Erfordert Ihren eigenen API-Key.
-
OpenAI: Cloud-Transkription mit Voice Activity Detection und automatischer Spracherkennung. Hedy setzt Sitzungen, die das 60-Minuten-Verbindungslimit von OpenAI überschreiten, automatisch fort, indem es im Hintergrund Verbindungen rotiert, sodass auch längere Meetings ohne Unterbrechung durchlaufen. Erfordert Ihren eigenen API-Key.
Lokale Spracherkennung konfigurieren
Bei Verwendung der lokalen Spracherkennung konnen Sie die Einstellungen fur Ihr Gerat optimieren:
Fur macOS-Nutzer:
-
Small Model: Schnellste Verarbeitung, empfohlen fur Intel-Macs
-
Regular Model: Ausgewogene Geschwindigkeit und Genauigkeit fur die meisten Nutzer
-
Large Model: Erweiterte Fahigkeiten fur nicht-englische Sprachen (erfordert 1,5 GB Download)
Fur iOS/Android-Nutzer:
-
Standard Model: Standardoption, geeignet fur die meisten Gerate
-
Large Model: Alternative Modelloption (iPhone 12+ oder Android ab 2024 empfohlen)
Voice Activity Detection (VAD):
VAD filtert automatisch Stille und Hintergrundgerausche heraus, um die Transkriptionsqualitat zu verbessern. Diese Funktion ist standardmassig fur die lokale Spracherkennung aktiviert.
-
Aktivieren/Deaktivieren: Schalten Sie VAD je nach Aufnahmeumgebung ein oder aus
-
Empfindlichkeit: Stellen Sie von “High Sensitivity” (erfasst mehr Sprache, einschliesslich leiserer Gerausche) bis “Maximum Filtering” (erfasst nur deutliche Sprache, filtert mehr Hintergrundgerausche) ein
Transkript-Geschwindigkeitseinstellungen:
-
Slower: Wartet auf vollstandige Satze vor der Anzeige
-
Normal: Ausgewogene Geschwindigkeit und Anzeigetiming
-
Faster: Nahezu Echtzeit-Anzeige mit haufigeren Aktualisierungen
Cloud-Anbieter einrichten
Deepgram einrichten:
-
Erstellen Sie ein Konto auf console.deepgram.com
-
Generieren Sie einen API-Key in Ihrem Dashboard
-
Wahlen Sie in den Hedy-Einstellungen Deepgram aus dem Dropdown
-
Fugen Sie Ihren API-Key ein und tippen Sie auf “Test” zur Uberprufung
-
Wahlen Sie Ihr bevorzugtes Modell und Ihre Spracheinstellungen
-
Legen Sie eine maximale Sitzungsdauer fest, um die Kosten zu kontrollieren
OpenAI einrichten:
-
Holen Sie Ihren API-Key von platform.openai.com/api-keys
-
Wahlen Sie in den Hedy-Einstellungen OpenAI aus dem Dropdown
-
Geben Sie Ihren API-Key ein und testen Sie die Verbindung
-
Wahlen Sie Ihr bevorzugtes Modell
-
Aktivieren Sie optional die Voice Activity Detection mit einstellbarer Empfindlichkeit
-
Legen Sie eine maximale Sitzungsdauer zur Kostenkontrolle fest
Den richtigen Anbieter wahlen
Wahlen Sie basierend auf Ihren Prioritaten und Ihrem Anwendungsfall:
-
Datenschutz zuerst: Nutzen Sie die lokale Spracherkennung — Audio verlasst niemals Ihr Gerat
-
Offline-Nutzung: Die lokale Spracherkennung funktioniert ohne Internet
-
Cloud-Funktionen: Deepgram und OpenAI bieten cloudbasierte Verarbeitung
-
Spracherkennung: Sowohl die lokale Losung als auch OpenAI bieten Voice Activity Detection
-
Intelligente Formatierung: Deepgram bietet automatische Formatierungsoptionen
-
Keine Nutzungskosten: Die lokale Spracherkennung hat keine minutenbasierten Kosten
-
Vollständig private Analyse auf dem Mac: Wenn Sie einen Mac mit Apple Silicon verwenden, können Sie die lokale Spracherkennung mit der lokalen KI-Verarbeitung kombinieren, um sowohl Transkription als auch KI-Analyse vollständig auf dem Gerät zu halten.
Kostenhinweise
Die Kostenauswirkungen der einzelnen Anbieter im Uberblick:
-
Local Speech Recognition: Kostenlos — keine Nutzungsgebuhren
-
Deepgram: Minutenbasierte Abrechnung (aktuelle Preise auf dem Dashboard einsehbar)
-
OpenAI: Nutzungsbasierte Abrechnung (aktuelle Preise auf der Plattform einsehbar)
Die Einstellung fur die maximale Sitzungsdauer hilft, versehentliche Uber-Nacht-Aufnahmen zu vermeiden und API-Kosten zu kontrollieren.
Empfohlene Vorgehensweisen
-
Beginnen Sie mit der lokalen Spracherkennung, um sich mit der Funktion vertraut zu machen
-
Testen Sie Cloud-Anbieter mit kurzen Aufnahmen vor wichtigen Sitzungen
-
Uberwachen Sie Ihre API-Nutzung auf den Anbieter-Dashboards, um Kosten im Blick zu behalten
-
Nutzen Sie verschiedene Anbieter fur verschiedene Szenarien je nach Bedarf
-
Wechseln Sie auf lokal, wenn Sie unterwegs sind oder eingeschranktes Internet haben
-
Stellen Sie angemessene maximale Sitzungsdauern ein (60-120 Minuten fur typische Meetings)
Fehlerbehebung
API-Key funktioniert nicht
-
Stellen Sie sicher, dass Sie den vollstandigen Key ohne Leerzeichen kopiert haben
-
Uberprufen Sie, ob Ihr Konto uber verfugbares Guthaben verfugt
-
Prufen Sie, ob der API-Key die erforderlichen Berechtigungen hat
-
Versuchen Sie, den Key im Anbieter-Dashboard neu zu generieren
Verbindungstest fehlgeschlagen
-
Uberprufen Sie die Stabilitat Ihrer Internetverbindung
-
Stellen Sie sicher, dass die Firewall keine WebSocket-Verbindungen blockiert
-
Vergewissern Sie sich, dass der API-Key aktiv ist und ausreichend Kontingent hat
-
Warten Sie einen Moment und versuchen Sie es erneut (vorubergehende Dienstprobleme)
Transkriptionsprobleme
-
Fur lokal: Versuchen Sie eine andere Modellgrosse
-
Fur Cloud: Uberprufen Sie die Stabilitat der Internetverbindung
-
Stellen Sie sicher, dass das Mikrofon korrekt konfiguriert ist
-
Minimieren Sie Hintergrundgerausche wahrend der Aufnahme
Einstellungen werden nicht gespeichert
-
Warten Sie, bis die Anzeige “Saved” erscheint
-
Wechseln Sie nicht den Bildschirm wahrend des Speicherns
-
Starten Sie die App neu, wenn das Problem weiterhin besteht
-
Stellen Sie eine stabile Internetverbindung sicher
Ihre API-Keys werden sicher im verschlusselten Schlusselbund Ihres Gerats gespeichert und niemals an Hedy-Server ubermittelt. Fur maximale Privatsphare bei sensiblen Gesprachen verwenden Sie immer die lokale Spracherkennung.