1. Foren
  2. » Kommentare
  3. » Software-Entwicklung
  4. » Alle Kommentare zum Artikel
  5. » API von Google Docs…

Qualität unbefriedigend

Anzeige
  1. Thema

Neues Thema Ansicht wechseln


  1. Qualität unbefriedigend

    Autor MovieKnight 01.10.09 - 10:40

    Habe gerade mal einen Test mit dem Bild gemacht, dass auf der Seite angeboten wird (RFC von HTTP/1.1).

    Originalbild: http://googlecodesamples.com/docs/php/HTTP.jpg

    OCR-Ergebins: http://docs.google.com/View?id=dgj3njtc_10d3hwvhd5

    Ich bin von der Qualität nicht sehr begeistert. (Ich habe hier aber auch gerade keine Vergleichsmöglichkeit zu anderen Texterkennern)

    Ich bin mir nicht sicher, ob es vielleicht besser funktioniert, wenn man die Sprache der Quelle angibt. Denn viele Fehler wären vermutlich einfach zu beheben, wenn man weiß, dass im englischen kein "ß" und kein "ñ" gibt...

    Vor allem scheint das OCR aber Probleme bei den geklammerten Zahlen zu haben.

    Nichtsdestotrotz ist das ein guter Service, wenn man an der Qualität der Erkennung noch etwas dreht.

  2. Re: Qualität unbefriedigend

    Autor MC Cool Mo D Aue 01.10.09 - 11:06

    Das sind spezialfälle diese geklamerten Zahlen.
    Das Ergebnis ist schon zufriedenstellend. Problem ist eher das die Sprache der OCR engine nicht richtig eingestellt ist (Englisch in diesem Fall) und deshalb die "ff" nicht richtig erkannt werden.

    Aber trotzdem ein normales Ergebnis für eine gute OCR engine

  3. Re: Qualität unbefriedigend

    Autor MovieKnight 01.10.09 - 14:19

    > Das sind spezialfälle diese geklamerten Zahlen.
    Naja, die erste Klammer erkennt er... Dann sollte sich der Algorithmus schon auf eine schließende einstellen, oder?

    > Das Ergebnis ist schon zufriedenstellend. Problem ist eher das die Sprache
    > der OCR engine nicht richtig eingestellt ist (Englisch in diesem Fall) und
    > deshalb die "ff" nicht richtig erkannt werden.

    Das mit der Sprache habe ich ja auch schon vermutet, allerdings liest sich folgender Abschnitt eher so, dass man die Dokumentensprache nur eingibt, für die automatische Übersetzung.

    >>Außerdem hat Google die Übersetzungsfunktion in die Programmierschnittstelle eingebaut. So können Texte nach dem Upload direkt übersetzt und in Googles Texte und Tabellen eingefügt werden. Dazu müssen nur die Parameter "targetLanguage" und "sourceLanguage" an den Uploadrequest angehängt werden<<

Neues Thema Ansicht wechseln


Entschuldigung, nur registrierte Benutzer dürfen in diesem Forum schreiben. Klicken Sie hier um sich einzuloggen


Meistgelesen
  1. Libreoffice

    "Wir wollen Nutzer in die ODF-Welt ziehen"

  2. Browser

    Kauft Facebook Opera?

  3. Blackberry

    RIM plant Massenentlassungen

  4. Datenschutz

    Neue EU-Regeln zu Cookies treten in Kraft

  5. Samsung Galaxy S3

    Siri braucht sich nicht zu fürchten


Meistkommentiert
  1. Kommentare: 171 | letzter Beitrag 20:42 Uhr

  2. Kommentare: 94 | letzter Beitrag 26.05. 19:45

  3. Kommentare: 77 | letzter Beitrag 20:57 Uhr

  4. Kommentare: 70 | letzter Beitrag 18:56 Uhr

  5. Kommentare: 60 | letzter Beitrag 20:11 Uhr

Mehr



Haben wir etwas übersehen?

E-Mail an news@golem.de


Lollipop Chainsaw angespielt: Blond und brutal
Lollipop Chainsaw angespielt
Blond und brutal

Der japanische Spieldesigner Goichi Suda - Fans sagen schlicht "Suda 51" - ist für schräge Actionspiele bekannt. Sein nächstes Werk schickt ein scheinbar braves Schulmädchen in den Kampf gegen Zombies.

  1. Spielepublisher in Not dtp Entertainment meldet Insolvenz an
  2. US-Umsätze im März 2012 Spielemarkt schrumpft weiter
  3. Starlight Inception Lucas-Arts-Veteran kämpft für das Weltraum-Action-Genre

Samsung XE300: Google Chromebox versehentlich ausgeliefert
Samsung XE300
Google Chromebox versehentlich ausgeliefert

Weitgehend unbemerkt hat der US-Händler Tigerdirect die ersten Chromebox-Systeme von Google ausgeliefert. Für 330 US-Dollar bekommt der Nutzer recht gute Hardware in Nettop-Form, die sehr viel leistungsfähiger ist als die des Chromebook mit ChromeOS.

  1. Googles Aura Chromium OS mit klassischem Desktop

Bernd Schlömer: Twittern und Mailen für die Piratenpartei im Dienst verboten
Bernd Schlömer
Twittern und Mailen für die Piratenpartei im Dienst verboten

Der neue Chef der Piratenpartei steht im Verteidigungsministerium unter Druck. Elektronische Kommunikation für seine Partei ist ihm in der Dienstzeit untersagt. "Es gibt Leute im Ministerium, die darauf warten, dass ich Fehler mache", sagte Schlömer.

  1. Hartmut Semken Berliner Piratenparteichef tritt zurück
  2. Schulschwänzen Piratenpartei gegen elektronisches Klassenbuch
  3. Piratenpartei NRW "Wir bringen einen Schuss Chili ins Parlament"

  1. Renesas: Chiphersteller will ein Drittel der Beschäftigten loswerden
    Renesas
    Chiphersteller will ein Drittel der Beschäftigten loswerden

    Renesas ist nach Elpida der zweite schwer angeschlagene japanische Chiphersteller. Renesas, das Hitachi, Mitsubishi Electric und NEC gehört, macht Verlust und will seine größte Fabrik verkaufen.

  2. Blackberry: RIM plant Massenentlassungen
    Blackberry
    RIM plant Massenentlassungen

    RIM soll in den kommenden Tagen erneut einen massiven Stellenabbau ankündigen. "Ich habe herausgefunden, welche Teile ich in meinem Puzzle nicht mehr benötige", sagte Firmenchef Thorsten Heins.

  3. Browser: Kauft Facebook Opera?
    Browser
    Kauft Facebook Opera?

    Ein britisches Blog will erfahren haben, dass Facebook den norwegischen Browserhersteller Opera Software kaufen will. Beide Unternehmen wollen sich dazu nicht äußern.


  1. 15:41

  2. 13:23

  3. 14:48

  4. 14:29

  5. 14:24

  6. 12:30

  7. 12:23

  8. 18:49