Abo
  1. Foren
  2. Kommentare
  3. Wissenschaft
  4. Alle Kommentare zum Artikel
  5. › Robotik: Hearbo, der hörende…

unspektakulär

Anzeige
  1. Thema

Neues Thema Ansicht wechseln


  1. unspektakulär

    Autor: Anonymer Nutzer 20.11.12 - 12:51

    also vor 5 jahren oder etwas mehr hätte sowas ja noch 'n wow-effekt hervorgerufen ... aber heute ... ist das eigentlich nichts weiter als angewandte spracherekennung und ausgabe, ein bisschen sensorik und künstlicher intelligenz ... verpackt in einen robotertorso mit lustig beweglichen armen ...

    aber vielleicht schaffen es ja mal all die forschungsgruppen bzgl. humanoider roboter ihre erkenntnisse und neusten entwicklungen zusammenzuschmeissen ... dann kommt vlt. endlich auch eine anständige küchen- oder pflegehilfe (für senioren) dabei heraus!



    2 mal bearbeitet, zuletzt am 20.11.12 12:53 durch McNoise.

  2. Unspektakulär ist es allenfalls deswegen...

    Autor: t3d_et 20.11.12 - 13:00

    ...weil es noch nicht perfekt funktioniert (der Roboter musste die Musik leiser machen um die Stimme zu verstehen).

    Ich habe vor über 10 Jahren einmal eine Spracherkennungssoftware ausprobiert und für schlecht befunden und heutige Spracherkennung ist noch immer nicht perfekt und versagt den Dienst bei störenden Umgebungsgeräuschen vollends.

    Also ein bisschen ein Fortschritt ist dieses System schon, und wenn es in so kleinen Schritten weitergeht, haben wir vielleicht in 100 Jahren eine Sprach- und Geräuscherkennung, die fast auf dem Niveau eines Menschen ist (ganz ist es wohl auch dann nicht möglich, wenn die Intelligenz weiterhin fehlt).

  3. Re: unspektakulär

    Autor: tingelchen 20.11.12 - 13:37

    Spracherkennung funktioniert noch immer eher schlecht als recht. Hier sind wir noch lange nicht an einem Punkt, wo man von Zuverlässig sprechen kann. Kleinste Nebengeräusche können das Ergebnis der Spracherkennung massiv verfälschen.

    Und was die KI angeht. Von einer echten Intelligenz sind wir ebenfalls noch Lichtjahre entfernt. Mir ist bis jetzt noch keine KI untergekommen, die gelerntes auch aktiv einsetzen kann und gelerntes auch an anderer Stelle in veränderter Form anwenden kann.


    Wobei der Roboter hier über keinerlei KI verfügt. Das erkennen von Musik macht ein Objekt noch lange nicht intelligent. Das "lernen" reduziert sich hier auf eine Datenbank mit Metainformationen. Wenn eine Geräuschquelle zu diesen Metainformationen passt, dann ist es Musik. Spamfilter nutzen die gleiche Grundlage. Das macht sie aber noch lange nicht intelligent ;)

  4. Re: Unspektakulär ist es allenfalls deswegen...

    Autor: Anonymer Nutzer 20.11.12 - 17:02

    t3d_et schrieb:
    --------------------------------------------------------------------------------
    > Ich habe vor über 10 Jahren einmal eine Spracherkennungssoftware
    > ausprobiert und für schlecht befunden und heutige Spracherkennung ist noch
    > immer nicht perfekt und versagt den Dienst bei störenden
    > Umgebungsgeräuschen vollends.

    also die rein menschliche spracherkennung funktioniert auch alles andere als perfekt ... dass sollten wir nicht vergessen - oder versteht ihr jeden menschen immer und sofort?! auch wir können bei umgebungsgeräuschen nicht alles genau verstehen. wir erkennen aber sprachliche zusammenhänge und können damit unverständliches kompensieren bspw.

    mit guter mikrofontechnik und digitalen signalprozessoren können heute störgeräusche extrem gut unterdrückt werden - viel besser noch als vor 10 jahren... bzgl. dem "hören" als solches ist die heutige digitale technik uns menschen weit überlegen ... die erst seit ein paar jahren verfügbaren digitalen hörgeräte bspw. sind ein segen für alle menschen mit beeinträchtigungen des gehörs!

    ich finde es durchaus bemerkenswert wie gut google, siri und welche cloudservices es nicht alles gibt menschliche sprache heute in text umsetzen ... m.e. absolut tauglich für den interaktiven einsatz (bspw. bei robotik) ... aber spektakulär ist es eben nicht mehr.



    2 mal bearbeitet, zuletzt am 20.11.12 17:04 durch McNoise.

  5. Re: unspektakulär

    Autor: amp amp nico 26.11.12 - 05:02

    Das Langzeitgedächtnis des Menschen ist auch nur eine Datenbank mit wild verknüpften Metainformationen, dieser Ansatz ist nicht zu unterschätzen.

    Ich frage mich nur, wann die Fortschritte in der Spracherkennung auch mal in nutzbaren Produkten für Endanwender ihren Einzug hält. Bsp. Ego-noise suppression. Schaut man am Computer einen Film oder spielt Webradio (was auch immer), wird entweder die Spracherkennung deaktiviert, derb gestört oder sie führt wild irgendwelche Anweisungen aus. Egal ob die Engine nun von Microsoft, Nuance oder sonstwem stammt.

Neues Thema Ansicht wechseln


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Zum Login

Anzeige
Stellenmarkt
  1. mobileX AG, München
  2. T-Systems International GmbH, Leinfelden-Echterdingen
  3. Leopold Kostal GmbH & Co. KG, Hagen
  4. über Hanseatisches Personalkontor Rottweil, Gottmadingen (bei Singen am Htwl.)

Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Blu-ray-Angebote
  1. (u. a. The Revenant, Batman v Superman, James Bond Spectre, Legend of Tarzan)
  2. 24,99€ (Vorbesteller-Preisgarantie)
  3. (u. a. The Big Bang Theory, The Vampire Diaries, True Detective)


Haben wir etwas übersehen?

E-Mail an news@golem.de


Debatte nach Wanna Cry: Sicherheitslücken veröffentlichen oder zurückhacken?
Debatte nach Wanna Cry
Sicherheitslücken veröffentlichen oder zurückhacken?
  1. Sicherheitslücke Fehlerhaft konfiguriertes Git-Verzeichnis bei Redcoon
  2. Hotelketten Buchungssystem Sabre kompromittiert Zahlungsdaten
  3. Onlinebanking Betrüger tricksen das mTAN-Verfahren aus

Sphero Lightning McQueen: Erst macht es Brummbrumm, dann verdreht es die Augen
Sphero Lightning McQueen
Erst macht es Brummbrumm, dann verdreht es die Augen

Quantencomputer: Nano-Kühlung für Qubits
Quantencomputer
Nano-Kühlung für Qubits
  1. IBM Q Mehr Qubits von IBM
  2. Quantencomputer Was sind diese Qubits?
  3. Verschlüsselung Kryptographie im Quantenzeitalter

  1. Service: Telekom verspricht kürzeres Warten auf Techniker
    Service
    Telekom verspricht kürzeres Warten auf Techniker

    Nur noch wenige Stunden auf den Telekom-Techniker warten, das würde der Telekom-Chef gerne versprechen. Doch er traut sich noch nicht so richtig.

  2. BVG: Fast alle U-Bahnhöfe mit offenem WLAN
    BVG
    Fast alle U-Bahnhöfe mit offenem WLAN

    Der Ausbau des BVG-WLAN ist fast fertiggestellt. Rund 10.000 Nutzer seien gleichzeitig in dem drahtlosen Netzwerk aktiv, Tendenz steigend.

  3. Android-Apps: Rechtemissbrauch erlaubt unsichtbare Tastaturmitschnitte
    Android-Apps
    Rechtemissbrauch erlaubt unsichtbare Tastaturmitschnitte

    Zwei Funktionen für Android-Apps können einfach missbraucht werden, um Nutzereingaben mitzulesen oder sogar weitere bösartige Apps zu installieren - ohne Wissen oder Zutun des Anwenders. Google hat bereits reagiert.


  1. 12:31

  2. 12:15

  3. 11:33

  4. 10:35

  5. 12:54

  6. 12:41

  7. 11:44

  8. 11:10