1. Foren
  2. Kommentare
  3. Applikationen
  4. Alle Kommentare zum Artikel
  5. › Speech to Text: Das bisschen…

Hier werden Äpfel mit Birnen verglichen

  1. Thema

Neues Thema Ansicht wechseln


  1. Hier werden Äpfel mit Birnen verglichen

    Autor: AntonZietz 15.09.20 - 14:33

    Es gibt grundsätzliche unterschiedliche Herangehensweisen bei der ASR: Einmal auf Sprecher trainierte Systeme, wie die Engine von Nuance, Dragon usw. und offene, Sprecherunabhängige Systeme.

    Zudem unterscheidet man Systeme die einen begrenzten Wortschatz haben (Alexa, Google Commands, usw) und Systeme, die auch dem System noch unbekannte Wörter erkennen wollen (aus Phonemen zusammengesetzt).

    Die Erkennungsrate ist natürlich auf einen einzelnen Sprecher trainiert mit begrenztem Wortschatz am höchsten. Dann kommen sprecherabhängige System mit offenem Wortschatz. Dann sprecherunabhängige Systeme mit geschlossenem Wortschatz, und zuletzt sprecherunabhängige Systeme mit offenem Wortschatz.

    Trainieren kann und muss man alle Systeme. Je besser die Trainings, desto besser die Ergebnisse.

    Für diese vier Bereiche gibt es jeweils Spezialsoftware. Keine ist für alle Szenarien gleich gut geeignet.

    Ihr habt bei eurem Test nicht angegeben, welche Szenarien ihr mit welcher Software(konfiguration) wie getestet habt. Vom Audiosetup (Mikrophone, Samplingrate, etc. mal ganz abgesehen). Nicht einmal Infos zum WER Setup.

    //EDIT// Mal ein paar Basics:

    https://en.wikipedia.org/wiki/Word_error_rate
    https://blog.timbunce.org/2018/05/15/a-comparison-of-automatic-speech-recognition-asr-systems/



    2 mal bearbeitet, zuletzt am 15.09.20 14:37 durch AntonZietz.

  1. Thema

Neues Thema Ansicht wechseln


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Sie müssen ausserdem in Ihrem Account-Profil unter Forum einen Nutzernamen vergeben haben. Zum Login

Stellenmarkt
  1. ERGO Group AG, Düsseldorf
  2. R2 Consulting GmbH, Bayern
  3. Universität Potsdam, Potsdam Innenstadt
  4. Universität zu Köln, Köln

Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Mobile-Angebote
  1. 326,74€
  2. 499,90€
  3. 206,10€ (mit Rabattcode "PFIFFIGER" - Bestpreis!)


Haben wir etwas übersehen?

E-Mail an news@golem.de


Gemanagte Netzwerke: Was eine Quasi-Virtualisierung von WANs und LANs bringt
Gemanagte Netzwerke
Was eine Quasi-Virtualisierung von WANs und LANs bringt

Cloud Managed LAN, Managed WAN Optimization, SD-WAN oder SD-LAN versprechen mehr Durchsatz, mehr Ausfallsicherheit oder weniger Datenstau.
Von Boris Mayer


    No One Lives Forever: Ein Retrogamer stirbt nie
    No One Lives Forever
    Ein Retrogamer stirbt nie

    Kompatibilitätsprobleme und schlimme Sprachausgabe - egal. Golem.de hat den 20 Jahre alten Shooter-Klassiker No One Lives Forever trotzdem neu gespielt.
    Von Benedikt Plass-Fleßenkämper

    1. Heimcomputer Retro Games plant Amiga-500-Nachbau
    2. Klassische Spielkonzepte Retro, brandneu
    3. Gaming-Handheld Analogue Pocket erscheint erst 2021

    Smarte Lautsprecher im Vergleichstest: Amazon hat den Besten
    Smarte Lautsprecher im Vergleichstest
    Amazon hat den Besten

    Echo 4, Nest Audio, Echo Dot 4 oder Homepod Mini? Bei smarten Lautsprechern für maximal 100 Euro ist die Größe entscheidend.
    Ein Test von Ingo Pakalski

    1. Smarter Lautsprecher Google zeigt Nest Audio für 100 Euro
    2. Harman Kardon Portabler Lautsprecher mit Google Assistant und Airplay 2
    3. Smarter Lautsprecher Google bestätigt offiziell neuen Nest-Lautsprecher