1. Foren
  2. » Kommentare
  3. » Wissenschaft
  4. » Alle Kommentare zum Artikel
  5. » Über 17.000 Bücher mit Recaptcha…

frage

Anzeige
  1. Thema

Neues Thema Ansicht wechseln


  1. frage

    Autor frage 15.08.08 - 19:20

    von wo weis die software, ob die vom user eingegebenen buchstaben korrekt sind? (oder steht das im txt und ich habe es überlesen?)

  2. Re: frage

    Autor kostverächter 15.08.08 - 19:25

    frage schrieb:
    -------------------------------------------------------
    > von wo weis die software, ob die vom user
    > eingegebenen buchstaben korrekt sind? (oder steht
    > das im txt und ich habe es überlesen?)

    Es werden immer zwei Wörter nebeneinander abgefragt. das eine ist bekannt.


  3. Re: frage

    Autor Elysium 15.08.08 - 19:25

    frage schrieb:
    -------------------------------------------------------
    > von wo weis die software, ob die vom user
    > eingegebenen buchstaben korrekt sind? (oder steht
    > das im txt und ich habe es überlesen?)

    "But if a computer can't read such a CAPTCHA, how does the system know the correct answer to the puzzle? Here's how: Each new word that cannot be read correctly by OCR is given to a user in conjunction with another word for which the answer is already known. The user is then asked to read both words. If they solve the one for which the answer is known, the system assumes their answer is correct for the new one. The system then gives the new image to a number of other people to determine, with higher confidence, whether the original answer was correct."

    Auszug aus der offiziellen Webseite. Aber gute Frage, ging mir auch durch den Kopf.

  4. Re: frage

    Autor dfg 15.08.08 - 20:07

    frage schrieb:
    -------------------------------------------------------
    > von wo weis die software, ob die vom user
    > eingegebenen buchstaben korrekt sind? (oder steht
    > das im txt und ich habe es überlesen?)

    Steht im Text:
    Eines der Wörter ist dem Programm bereits bekannt, das andere wird nur gespeichert, der Anwender kommt also weiter. Dieses andere Wort muß nun ein anderer Anwender bestätigen. Gibt er das gleiche Wort an, wird es richtig sein. Das Wort ist also erraten.


  5. hä? das steht nicht im artikel.

    Autor dzhdrzh 15.08.08 - 20:55

    ist nur verlinkt.

  6. reCAPTCHA Poisoning

    Autor Sir Jective 16.08.08 - 17:14

    Elysium schrieb:
    -------------------------------------------------------
    > frage schrieb:
    > --------------------------------------------------
    > -----
    > > von wo weis die software, ob die vom
    > user
    > eingegebenen buchstaben korrekt sind?
    > (oder steht
    > das im txt und ich habe es
    > überlesen?)
    >
    > "But if a computer can't read such a CAPTCHA, how
    > does the system know the correct answer to the
    > puzzle? Here's how: Each new word that cannot be
    > read correctly by OCR is given to a user in
    > conjunction with another word for which the answer
    > is already known. The user is then asked to read
    > both words. If they solve the one for which the
    > answer is known, the system assumes their answer
    > is correct for the new one. The system then gives
    > the new image to a number of other people to
    > determine, with higher confidence, whether the
    > original answer was correct."
    >
    > Auszug aus der offiziellen Webseite. Aber gute
    > Frage, ging mir auch durch den Kopf.
    >

    Man läßt (massenweise) selbst ein OCR über diese reCaptchas drüberlaufen. Man geht davon aus, daß im Großteil der Fälle das OCR ebenso intelligent ist, wie das von Carnegie Mellon. Beim erkannten Captcha gibt der Bot also die richtige Zeichenfolge ein, beim anderen irgendeine zufällig generierte.

    Zusätzlich legt man eine Datenbank für die nicht erkannten Captchas an, in der die erstmals generierte Zufallszeichenfolge gespeichert wird, so daß jedesmal dieselbe eingegeben wird.

    Hat man genügend Ressourcen, verliert das reCAPTCHA-System das Vertrauen in die richtigen Eingaben der echten Nutzer und glaubt unsere zufallsgenerierten.

    Statt zufällig zu generieren, könnte man die falschen Zeichenfolgen auch aus einer Liste von Obszönitäten wählen, dadurch wird das ganze lustiger.

  7. Re: reCAPTCHA Poisoning

    Autor Robin Mehner 16.08.08 - 17:59

    Interessante Idee, aber ich denke bei dem Aufwand würde man eher in Richtung des Pornproxies gehen (Zeig dem User unter dem Versprechen kostenloser nackter Tatsachen das Captcha und lass es von ihm lösen ...), dürfte am Ende effektiver sein.

  8. Re: reCAPTCHA Poisoning

    Autor Blizzz 16.08.08 - 22:14

    Sir Jective schrieb:
    -------------------------------------------------------
    > Elysium schrieb:
    > --------------------------------------------------
    > -----
    > > frage schrieb:
    >
    > --------------------------------------------------
    >
    > -----
    > > von wo weis die software, ob
    > die vom
    > user
    > eingegebenen buchstaben
    > korrekt sind?
    > (oder steht
    > das im txt und
    > ich habe es
    > überlesen?)
    >
    > "But if a
    > computer can't read such a CAPTCHA, how
    > does
    > the system know the correct answer to the
    >
    > puzzle? Here's how: Each new word that cannot
    > be
    > read correctly by OCR is given to a user
    > in
    > conjunction with another word for which
    > the answer
    > is already known. The user is then
    > asked to read
    > both words. If they solve the
    > one for which the
    > answer is known, the system
    > assumes their answer
    > is correct for the new
    > one. The system then gives
    > the new image to a
    > number of other people to
    > determine, with
    > higher confidence, whether the
    > original
    > answer was correct."
    >
    > Auszug aus der
    > offiziellen Webseite. Aber gute
    > Frage, ging
    > mir auch durch den Kopf.
    >
    > Man läßt (massenweise) selbst ein OCR über diese
    > reCaptchas drüberlaufen. Man geht davon aus, daß
    > im Großteil der Fälle das OCR ebenso intelligent
    > ist, wie das von Carnegie Mellon. Beim erkannten
    > Captcha gibt der Bot also die richtige
    > Zeichenfolge ein, beim anderen irgendeine zufällig
    > generierte.

    Die bekannten Worte werden nicht durch ein OCR ermittelt, sondern durch die Antworten der Benutzer. Wenn ein unbekanntes Wort genügend oft einheitlich eingegeben worden ist, wird es ein bekanntes Wort und so eingesetzt. Ein OCR kommt da nicht ran (solang die Erkennung nicht verbessert wird).

  9. Re: reCAPTCHA Poisoning

    Autor chithanh 17.08.08 - 00:14

    Sir Jective schrieb:
    -------------------------------------------------------
    > Zusätzlich legt man eine Datenbank für die nicht
    > erkannten Captchas an, in der die erstmals
    > generierte Zufallszeichenfolge gespeichert wird,
    > so daß jedesmal dieselbe eingegeben wird.

    Das würde erfordern, dass man die reCAPTCHAs wiedererkennen kann. Diese werden jedoch bei jeder Anzeige deformiert.

  10. Re: reCAPTCHA Poisoning

    Autor Sir Jective 17.08.08 - 03:45

    Blizzz schrieb:
    -------------------------------------------------------
    > Sir Jective schrieb:
    > --------------------------------------------------
    > -----
    > > Elysium schrieb:
    >
    > --------------------------------------------------
    >
    > -----
    > > frage schrieb:
    >
    > --------------------------------------------------
    >
    > -----
    > > von wo weis die
    > software, ob
    > die vom
    > user
    >
    > eingegebenen buchstaben
    > korrekt sind?
    >
    > (oder steht
    > das im txt und
    > ich habe
    > es
    > u:berlesen?)
    >
    > "But if a
    >
    > computer can't read such a CAPTCHA, how
    >
    > does
    > the system know the correct answer to
    > the
    >
    > puzzle? Here's how: Each new word
    > that cannot
    > be
    > read correctly by OCR is
    > given to a user
    > in
    > conjunction with
    > another word for which
    > the answer
    > is
    > already known. The user is then
    > asked to
    > read
    > both words. If they solve the
    > one
    > for which the
    > answer is known, the
    > system
    > assumes their answer
    > is correct
    > for the new
    > one. The system then gives
    >
    > the new image to a
    > number of other people
    > to
    > determine, with
    > higher confidence,
    > whether the
    > original
    > answer was
    > correct."
    >
    > Auszug aus der
    >
    > offiziellen Webseite. Aber gute
    > Frage,
    > ging
    > mir auch durch den Kopf.
    >
    > Man la:sst (massenweise) selbst ein OCR u:ber
    > diese
    > reCaptchas dru:berlaufen. Man geht davon
    > aus, dass
    > im Grossteil der Fa:lle das OCR ebenso
    > intelligent
    > ist, wie das von Carnegie Mellon.
    > Beim erkannten
    > Captcha gibt der Bot also die
    > richtige
    > Zeichenfolge ein, beim anderen
    > irgendeine zufa:llig
    > generierte.
    >
    > Die bekannten Worte werden nicht durch ein OCR
    > ermittelt, sondern durch die Antworten der
    > Benutzer. Wenn ein unbekanntes Wort genu:gend oft
    > einheitlich eingegeben worden ist, wird es ein
    > bekanntes Wort und so eingesetzt. Ein OCR kommt da
    > nicht ran (solang die Erkennung nicht verbessert
    > wird).
    Naja, sie mu**ten ja schon irgendwie anfange.
    Also am Anfang, als sie noch keine richtigen, von den Nutzern erkannten Captchas hatten, h**tte man so einsteigen k**nne


  11. Re: reCAPTCHA Poisoning

    Autor Cobinja 17.08.08 - 15:57

    Sir Jective schrieb:
    -------------------------------------------------------
    > Elysium schrieb:
    > --------------------------------------------------
    > -----
    > > frage schrieb:
    >
    > --------------------------------------------------
    >
    > -----
    > > von wo weis die software, ob
    > die vom
    > user
    > eingegebenen buchstaben
    > korrekt sind?
    > (oder steht
    > das im txt und
    > ich habe es
    > überlesen?)
    >
    > "But if a
    > computer can't read such a CAPTCHA, how
    > does
    > the system know the correct answer to the
    >
    > puzzle? Here's how: Each new word that cannot
    > be
    > read correctly by OCR is given to a user
    > in
    > conjunction with another word for which
    > the answer
    > is already known. The user is then
    > asked to read
    > both words. If they solve the
    > one for which the
    > answer is known, the system
    > assumes their answer
    > is correct for the new
    > one. The system then gives
    > the new image to a
    > number of other people to
    > determine, with
    > higher confidence, whether the
    > original
    > answer was correct."
    >
    > Auszug aus der
    > offiziellen Webseite. Aber gute
    > Frage, ging
    > mir auch durch den Kopf.
    >
    > Man läßt (massenweise) selbst ein OCR über diese
    > reCaptchas drüberlaufen. Man geht davon aus, daß
    > im Großteil der Fälle das OCR ebenso intelligent
    > ist, wie das von Carnegie Mellon. Beim erkannten
    > Captcha gibt der Bot also die richtige
    > Zeichenfolge ein, beim anderen irgendeine zufällig
    > generierte.
    >
    > Zusätzlich legt man eine Datenbank für die nicht
    > erkannten Captchas an, in der die erstmals
    > generierte Zufallszeichenfolge gespeichert wird,
    > so daß jedesmal dieselbe eingegeben wird.
    >
    > Hat man genügend Ressourcen, verliert das
    > reCAPTCHA-System das Vertrauen in die richtigen
    > Eingaben der echten Nutzer und glaubt unsere
    > zufallsgenerierten.
    >
    > Statt zufällig zu generieren, könnte man die
    > falschen Zeichenfolgen auch aus einer Liste von
    > Obszönitäten wählen, dadurch wird das ganze
    > lustiger.
    >

    Technisch wäre das sicherlich interessant.

    Da das System aber dazu genutzt wird, alte Bücher und Zeitungen zu digitalisieren, sollte man daran noch nicht mal denken.

  12. Re: reCAPTCHA Poisoning

    Autor Sir Jective 17.08.08 - 21:04

    Cobinja schrieb:
    -------------------------------------------------------
    > Sir Jective schrieb:
    > --------------------------------------------------
    > -----
    > > Elysium schrieb:
    >
    > --------------------------------------------------
    >
    > -----
    > > frage schrieb:
    >
    > --------------------------------------------------
    >
    > -----
    > > von wo weis die
    > software, ob
    > die vom
    > user
    >
    > eingegebenen buchstaben
    > korrekt sind?
    >
    > (oder steht
    > das im txt und
    > ich habe
    > es
    > überlesen?)
    >
    > "But if a
    >
    > computer can't read such a CAPTCHA, how
    >
    > does
    > the system know the correct answer to
    > the
    >
    > puzzle? Here's how: Each new word
    > that cannot
    > be
    > read correctly by OCR is
    > given to a user
    > in
    > conjunction with
    > another word for which
    > the answer
    > is
    > already known. The user is then
    > asked to
    > read
    > both words. If they solve the
    > one
    > for which the
    > answer is known, the
    > system
    > assumes their answer
    > is correct
    > for the new
    > one. The system then gives
    >
    > the new image to a
    > number of other people
    > to
    > determine, with
    > higher confidence,
    > whether the
    > original
    > answer was
    > correct."
    >
    > Auszug aus der
    >
    > offiziellen Webseite. Aber gute
    > Frage,
    > ging
    > mir auch durch den Kopf.
    >
    > Man läßt (massenweise) selbst ein OCR über
    > diese
    > reCaptchas drüberlaufen. Man geht davon
    > aus, daß
    > im Großteil der Fälle das OCR ebenso
    > intelligent
    > ist, wie das von Carnegie Mellon.
    > Beim erkannten
    > Captcha gibt der Bot also die
    > richtige
    > Zeichenfolge ein, beim anderen
    > irgendeine zufällig
    > generierte.
    >
    > Zusätzlich legt man eine Datenbank für die
    > nicht
    > erkannten Captchas an, in der die
    > erstmals
    > generierte Zufallszeichenfolge
    > gespeichert wird,
    > so daß jedesmal dieselbe
    > eingegeben wird.
    >
    > Hat man genügend
    > Ressourcen, verliert das
    > reCAPTCHA-System das
    > Vertrauen in die richtigen
    > Eingaben der
    > echten Nutzer und glaubt unsere
    >
    > zufallsgenerierten.
    >
    > Statt zufällig zu
    > generieren, könnte man die
    > falschen
    > Zeichenfolgen auch aus einer Liste von
    >
    > Obszönitäten wählen, dadurch wird das ganze
    >
    > lustiger.
    >
    > Technisch wäre das sicherlich interessant.
    >
    > Da das System aber dazu genutzt wird, alte Bücher
    > und Zeitungen zu digitalisieren, sollte man daran
    > noch nicht mal denken.
    >

    Wieso? Sind alte Bücher und Zeitungen irgend etwas heiliges? Oder sind sie für die Freiheit oder die Unversehrtheit von irgendwelchen Menschen von Bedeutung?

    Wäre zwar schon lame ein Forschungsprojekt zu sabotieren, aber der Schaden wäre rein wirtschaftlich.

  13. Re: reCAPTCHA Poisoning

    Autor JTL 18.08.08 - 16:38

    Cobinja schrieb:
    -------------------------------------------------------
    > Sir Jective schrieb:
    > --------------------------------------------------
    > -----
    > > Elysium schrieb:
    >
    > --------------------------------------------------
    >
    > -----
    > > frage schrieb:
    >
    > --------------------------------------------------
    >
    > -----
    > > von wo weis die
    > software, ob
    > die vom
    > user
    >
    > eingegebenen buchstaben
    > korrekt sind?
    >
    > (oder steht
    > das im txt und
    > ich habe
    > es
    > überlesen?)
    >
    > "But if a
    >
    > computer can't read such a CAPTCHA, how
    >
    > does
    > the system know the correct answer to
    > the
    >
    > puzzle? Here's how: Each new word
    > that cannot
    > be
    > read correctly by OCR is
    > given to a user
    > in
    > conjunction with
    > another word for which
    > the answer
    > is
    > already known. The user is then
    > asked to
    > read
    > both words. If they solve the
    > one
    > for which the
    > answer is known, the
    > system
    > assumes their answer
    > is correct
    > for the new
    > one. The system then gives
    >
    > the new image to a
    > number of other people
    > to
    > determine, with
    > higher confidence,
    > whether the
    > original
    > answer was
    > correct."
    >
    > Auszug aus der
    >
    > offiziellen Webseite. Aber gute
    > Frage,
    > ging
    > mir auch durch den Kopf.
    >
    > Man läßt (massenweise) selbst ein OCR über
    > diese
    > reCaptchas drüberlaufen. Man geht davon
    > aus, daß
    > im Großteil der Fälle das OCR ebenso
    > intelligent
    > ist, wie das von Carnegie Mellon.
    > Beim erkannten
    > Captcha gibt der Bot also die
    > richtige
    > Zeichenfolge ein, beim anderen
    > irgendeine zufällig
    > generierte.
    >
    > Zusätzlich legt man eine Datenbank für die
    > nicht
    > erkannten Captchas an, in der die
    > erstmals
    > generierte Zufallszeichenfolge
    > gespeichert wird,
    > so daß jedesmal dieselbe
    > eingegeben wird.
    >
    > Hat man genügend
    > Ressourcen, verliert das
    > reCAPTCHA-System das
    > Vertrauen in die richtigen
    > Eingaben der
    > echten Nutzer und glaubt unsere
    >
    > zufallsgenerierten.
    >
    > Statt zufällig zu
    > generieren, könnte man die
    > falschen
    > Zeichenfolgen auch aus einer Liste von
    >
    > Obszönitäten wählen, dadurch wird das ganze
    >
    > lustiger.
    >
    > Technisch wäre das sicherlich interessant.
    >
    > Da das System aber dazu genutzt wird, alte Bücher
    > und Zeitungen zu digitalisieren, sollte man daran
    > noch nicht mal denken.
    >


    Und weil wir nicht mal daran denken sollten, tun das die "pösen Puben" nicht?

    Gerade an sowas sollte ein Entwickler denken. Das (u.A.) macht m.E. einen guten Entwickler aus!

  14. Re: reCAPTCHA Poisoning

    Autor pcmkr 16.09.09 - 23:04

    Sir Jective schrieb:
    --------------------------------------------------------------------------------
    > Wieso? Sind alte Bücher und Zeitungen irgend etwas heiliges? Oder sind sie
    > für die Freiheit oder die Unversehrtheit von irgendwelchen Menschen von
    > Bedeutung?
    >
    > Wäre zwar schon lame ein Forschungsprojekt zu sabotieren, aber der Schaden
    > wäre rein wirtschaftlich.
    >
    "Rein wirtschaftlich".... was soll das denn sein? Klar, wenn in der dritten Welt das Geld fehlt für Medizin oder was zu essen, ist das natürlich auch ein "rein wirtschaftliches" Problem.

Neues Thema Ansicht wechseln


Entschuldigung, nur registrierte Benutzer dürfen in diesem Forum schreiben. Klicken Sie hier um sich einzuloggen


Meistgelesen
  1. Blackberry

    RIM plant Massenentlassungen

  2. Libreoffice

    "Wir wollen Nutzer in die ODF-Welt ziehen"

  3. Renesas

    Chiphersteller will ein Drittel der Beschäftigten loswerden

  4. Browser

    Kauft Facebook Opera?

  5. Samsung Galaxy S3

    Siri braucht sich nicht zu fürchten


Meistkommentiert
  1. Kommentare: 173 | letzter Beitrag 27.05. 23:42

  2. Kommentare: 94 | letzter Beitrag 26.05. 19:45

  3. Kommentare: 83 | letzter Beitrag 02:00 Uhr

  4. Kommentare: 72 | letzter Beitrag 02:56 Uhr

  5. Kommentare: 66 | letzter Beitrag 02:26 Uhr

Mehr



Haben wir etwas übersehen?

E-Mail an news@golem.de


Energy Harvesting: Strom aus dem Teelicht
Energy Harvesting
Strom aus dem Teelicht

T-Pod ist ein kleines Kraftwerk für unterwegs. Betrieben mit einer kleinen Kerze, erzeugt das Gerät Strom für eine Leselampe oder das Laden des Smartphone-Akkus.

  1. Energy Harvesting Viren in der Schuhsohle liefern Strom fürs Smartphone
  2. Saubere Energie In New York kommt Strom bald aus der Wasserleitung

F2, F8, F12: Windows 8 startet zu schnell
F2, F8, F12
Windows 8 startet zu schnell

Windows 8 kann auf entsprechender Hardware in weniger als 8 Sekunden booten. Dabei bleibt zu wenig Zeit, um den Bootvorgang zum Sprung ins Bios, ins UEFI-Menü oder in die Startauswahl von Windows zu unterbrechen.

  1. Dice Einige Frostbite-2-Spiele nur mit 64-Bit-Betriebssystem
  2. Windows RT Windows-Tablet-Lizenz soll angeblich 100 US-Dollar kosten
  3. Windows 8 Release Preview Microsoft verbessert Multi-Monitor-Unterstützung

Kim Dotcom: "Gebt mir meine Rechner zurück!"
Kim Dotcom
"Gebt mir meine Rechner zurück!"

Kim Schmitz will Zugriff auf seine 135 Computer und Festplatten, die die neuseeländischen Behörden im Januar 2012 beschlagnahmt haben. Das FBI halte das Material von der Justiz in Neuseeland zurück, um seine Verteidigung im Fall Megaupload zu erschweren, sagt er.

  1. Megaupload Kim Dotcom darf wieder das Internet benutzen
  2. Nach Megaupload Mediafire und weitere Filehoster im Fokus der Filmindustrie
  3. Megaupload Kim Schmitz muss mit monatlich 37.000 Euro zurechtkommen

  1. Renesas: Chiphersteller will ein Drittel der Beschäftigten loswerden
    Renesas
    Chiphersteller will ein Drittel der Beschäftigten loswerden

    Renesas ist nach Elpida der zweite schwer angeschlagene japanische Chiphersteller. Renesas, das Hitachi, Mitsubishi Electric und NEC gehört, macht Verlust und will seine größte Fabrik verkaufen.

  2. Blackberry: RIM plant Massenentlassungen
    Blackberry
    RIM plant Massenentlassungen

    RIM soll in den kommenden Tagen erneut einen massiven Stellenabbau ankündigen. "Ich habe herausgefunden, welche Teile ich in meinem Puzzle nicht mehr benötige", sagte Firmenchef Thorsten Heins.

  3. Browser: Kauft Facebook Opera?
    Browser
    Kauft Facebook Opera?

    Ein britisches Blog will erfahren haben, dass Facebook den norwegischen Browserhersteller Opera Software kaufen will. Beide Unternehmen wollen sich dazu nicht äußern.


  1. 15:41

  2. 13:23

  3. 14:48

  4. 14:29

  5. 14:24

  6. 12:30

  7. 12:23

  8. 18:49