von wo weis die software, ob die vom user eingegebenen buchstaben korrekt sind? (oder steht das im txt und ich habe es überlesen?)
frage schrieb:
-------------------------------------------------------
> von wo weis die software, ob die vom user
> eingegebenen buchstaben korrekt sind? (oder steht
> das im txt und ich habe es überlesen?)
Es werden immer zwei Wörter nebeneinander abgefragt. das eine ist bekannt.
frage schrieb:
-------------------------------------------------------
> von wo weis die software, ob die vom user
> eingegebenen buchstaben korrekt sind? (oder steht
> das im txt und ich habe es überlesen?)
"But if a computer can't read such a CAPTCHA, how does the system know the correct answer to the puzzle? Here's how: Each new word that cannot be read correctly by OCR is given to a user in conjunction with another word for which the answer is already known. The user is then asked to read both words. If they solve the one for which the answer is known, the system assumes their answer is correct for the new one. The system then gives the new image to a number of other people to determine, with higher confidence, whether the original answer was correct."
Auszug aus der offiziellen Webseite. Aber gute Frage, ging mir auch durch den Kopf.
frage schrieb:
-------------------------------------------------------
> von wo weis die software, ob die vom user
> eingegebenen buchstaben korrekt sind? (oder steht
> das im txt und ich habe es überlesen?)
Steht im Text:
Eines der Wörter ist dem Programm bereits bekannt, das andere wird nur gespeichert, der Anwender kommt also weiter. Dieses andere Wort muß nun ein anderer Anwender bestätigen. Gibt er das gleiche Wort an, wird es richtig sein. Das Wort ist also erraten.
ist nur verlinkt.
Elysium schrieb:
-------------------------------------------------------
> frage schrieb:
> --------------------------------------------------
> -----
> > von wo weis die software, ob die vom
> user
> eingegebenen buchstaben korrekt sind?
> (oder steht
> das im txt und ich habe es
> überlesen?)
>
> "But if a computer can't read such a CAPTCHA, how
> does the system know the correct answer to the
> puzzle? Here's how: Each new word that cannot be
> read correctly by OCR is given to a user in
> conjunction with another word for which the answer
> is already known. The user is then asked to read
> both words. If they solve the one for which the
> answer is known, the system assumes their answer
> is correct for the new one. The system then gives
> the new image to a number of other people to
> determine, with higher confidence, whether the
> original answer was correct."
>
> Auszug aus der offiziellen Webseite. Aber gute
> Frage, ging mir auch durch den Kopf.
>
Man läßt (massenweise) selbst ein OCR über diese reCaptchas drüberlaufen. Man geht davon aus, daß im Großteil der Fälle das OCR ebenso intelligent ist, wie das von Carnegie Mellon. Beim erkannten Captcha gibt der Bot also die richtige Zeichenfolge ein, beim anderen irgendeine zufällig generierte.
Zusätzlich legt man eine Datenbank für die nicht erkannten Captchas an, in der die erstmals generierte Zufallszeichenfolge gespeichert wird, so daß jedesmal dieselbe eingegeben wird.
Hat man genügend Ressourcen, verliert das reCAPTCHA-System das Vertrauen in die richtigen Eingaben der echten Nutzer und glaubt unsere zufallsgenerierten.
Statt zufällig zu generieren, könnte man die falschen Zeichenfolgen auch aus einer Liste von Obszönitäten wählen, dadurch wird das ganze lustiger.
Interessante Idee, aber ich denke bei dem Aufwand würde man eher in Richtung des Pornproxies gehen (Zeig dem User unter dem Versprechen kostenloser nackter Tatsachen das Captcha und lass es von ihm lösen ...), dürfte am Ende effektiver sein.
Sir Jective schrieb:
-------------------------------------------------------
> Elysium schrieb:
> --------------------------------------------------
> -----
> > frage schrieb:
>
> --------------------------------------------------
>
> -----
> > von wo weis die software, ob
> die vom
> user
> eingegebenen buchstaben
> korrekt sind?
> (oder steht
> das im txt und
> ich habe es
> überlesen?)
>
> "But if a
> computer can't read such a CAPTCHA, how
> does
> the system know the correct answer to the
>
> puzzle? Here's how: Each new word that cannot
> be
> read correctly by OCR is given to a user
> in
> conjunction with another word for which
> the answer
> is already known. The user is then
> asked to read
> both words. If they solve the
> one for which the
> answer is known, the system
> assumes their answer
> is correct for the new
> one. The system then gives
> the new image to a
> number of other people to
> determine, with
> higher confidence, whether the
> original
> answer was correct."
>
> Auszug aus der
> offiziellen Webseite. Aber gute
> Frage, ging
> mir auch durch den Kopf.
>
> Man läßt (massenweise) selbst ein OCR über diese
> reCaptchas drüberlaufen. Man geht davon aus, daß
> im Großteil der Fälle das OCR ebenso intelligent
> ist, wie das von Carnegie Mellon. Beim erkannten
> Captcha gibt der Bot also die richtige
> Zeichenfolge ein, beim anderen irgendeine zufällig
> generierte.
Die bekannten Worte werden nicht durch ein OCR ermittelt, sondern durch die Antworten der Benutzer. Wenn ein unbekanntes Wort genügend oft einheitlich eingegeben worden ist, wird es ein bekanntes Wort und so eingesetzt. Ein OCR kommt da nicht ran (solang die Erkennung nicht verbessert wird).
Sir Jective schrieb:
-------------------------------------------------------
> Zusätzlich legt man eine Datenbank für die nicht
> erkannten Captchas an, in der die erstmals
> generierte Zufallszeichenfolge gespeichert wird,
> so daß jedesmal dieselbe eingegeben wird.
Das würde erfordern, dass man die reCAPTCHAs wiedererkennen kann. Diese werden jedoch bei jeder Anzeige deformiert.
Blizzz schrieb:
-------------------------------------------------------
> Sir Jective schrieb:
> --------------------------------------------------
> -----
> > Elysium schrieb:
>
> --------------------------------------------------
>
> -----
> > frage schrieb:
>
> --------------------------------------------------
>
> -----
> > von wo weis die
> software, ob
> die vom
> user
>
> eingegebenen buchstaben
> korrekt sind?
>
> (oder steht
> das im txt und
> ich habe
> es
> u:berlesen?)
>
> "But if a
>
> computer can't read such a CAPTCHA, how
>
> does
> the system know the correct answer to
> the
>
> puzzle? Here's how: Each new word
> that cannot
> be
> read correctly by OCR is
> given to a user
> in
> conjunction with
> another word for which
> the answer
> is
> already known. The user is then
> asked to
> read
> both words. If they solve the
> one
> for which the
> answer is known, the
> system
> assumes their answer
> is correct
> for the new
> one. The system then gives
>
> the new image to a
> number of other people
> to
> determine, with
> higher confidence,
> whether the
> original
> answer was
> correct."
>
> Auszug aus der
>
> offiziellen Webseite. Aber gute
> Frage,
> ging
> mir auch durch den Kopf.
>
> Man la:sst (massenweise) selbst ein OCR u:ber
> diese
> reCaptchas dru:berlaufen. Man geht davon
> aus, dass
> im Grossteil der Fa:lle das OCR ebenso
> intelligent
> ist, wie das von Carnegie Mellon.
> Beim erkannten
> Captcha gibt der Bot also die
> richtige
> Zeichenfolge ein, beim anderen
> irgendeine zufa:llig
> generierte.
>
> Die bekannten Worte werden nicht durch ein OCR
> ermittelt, sondern durch die Antworten der
> Benutzer. Wenn ein unbekanntes Wort genu:gend oft
> einheitlich eingegeben worden ist, wird es ein
> bekanntes Wort und so eingesetzt. Ein OCR kommt da
> nicht ran (solang die Erkennung nicht verbessert
> wird).
Naja, sie mu**ten ja schon irgendwie anfange.
Also am Anfang, als sie noch keine richtigen, von den Nutzern erkannten Captchas hatten, h**tte man so einsteigen k**nne
Sir Jective schrieb:
-------------------------------------------------------
> Elysium schrieb:
> --------------------------------------------------
> -----
> > frage schrieb:
>
> --------------------------------------------------
>
> -----
> > von wo weis die software, ob
> die vom
> user
> eingegebenen buchstaben
> korrekt sind?
> (oder steht
> das im txt und
> ich habe es
> überlesen?)
>
> "But if a
> computer can't read such a CAPTCHA, how
> does
> the system know the correct answer to the
>
> puzzle? Here's how: Each new word that cannot
> be
> read correctly by OCR is given to a user
> in
> conjunction with another word for which
> the answer
> is already known. The user is then
> asked to read
> both words. If they solve the
> one for which the
> answer is known, the system
> assumes their answer
> is correct for the new
> one. The system then gives
> the new image to a
> number of other people to
> determine, with
> higher confidence, whether the
> original
> answer was correct."
>
> Auszug aus der
> offiziellen Webseite. Aber gute
> Frage, ging
> mir auch durch den Kopf.
>
> Man läßt (massenweise) selbst ein OCR über diese
> reCaptchas drüberlaufen. Man geht davon aus, daß
> im Großteil der Fälle das OCR ebenso intelligent
> ist, wie das von Carnegie Mellon. Beim erkannten
> Captcha gibt der Bot also die richtige
> Zeichenfolge ein, beim anderen irgendeine zufällig
> generierte.
>
> Zusätzlich legt man eine Datenbank für die nicht
> erkannten Captchas an, in der die erstmals
> generierte Zufallszeichenfolge gespeichert wird,
> so daß jedesmal dieselbe eingegeben wird.
>
> Hat man genügend Ressourcen, verliert das
> reCAPTCHA-System das Vertrauen in die richtigen
> Eingaben der echten Nutzer und glaubt unsere
> zufallsgenerierten.
>
> Statt zufällig zu generieren, könnte man die
> falschen Zeichenfolgen auch aus einer Liste von
> Obszönitäten wählen, dadurch wird das ganze
> lustiger.
>
Technisch wäre das sicherlich interessant.
Da das System aber dazu genutzt wird, alte Bücher und Zeitungen zu digitalisieren, sollte man daran noch nicht mal denken.
Cobinja schrieb:
-------------------------------------------------------
> Sir Jective schrieb:
> --------------------------------------------------
> -----
> > Elysium schrieb:
>
> --------------------------------------------------
>
> -----
> > frage schrieb:
>
> --------------------------------------------------
>
> -----
> > von wo weis die
> software, ob
> die vom
> user
>
> eingegebenen buchstaben
> korrekt sind?
>
> (oder steht
> das im txt und
> ich habe
> es
> überlesen?)
>
> "But if a
>
> computer can't read such a CAPTCHA, how
>
> does
> the system know the correct answer to
> the
>
> puzzle? Here's how: Each new word
> that cannot
> be
> read correctly by OCR is
> given to a user
> in
> conjunction with
> another word for which
> the answer
> is
> already known. The user is then
> asked to
> read
> both words. If they solve the
> one
> for which the
> answer is known, the
> system
> assumes their answer
> is correct
> for the new
> one. The system then gives
>
> the new image to a
> number of other people
> to
> determine, with
> higher confidence,
> whether the
> original
> answer was
> correct."
>
> Auszug aus der
>
> offiziellen Webseite. Aber gute
> Frage,
> ging
> mir auch durch den Kopf.
>
> Man läßt (massenweise) selbst ein OCR über
> diese
> reCaptchas drüberlaufen. Man geht davon
> aus, daß
> im Großteil der Fälle das OCR ebenso
> intelligent
> ist, wie das von Carnegie Mellon.
> Beim erkannten
> Captcha gibt der Bot also die
> richtige
> Zeichenfolge ein, beim anderen
> irgendeine zufällig
> generierte.
>
> Zusätzlich legt man eine Datenbank für die
> nicht
> erkannten Captchas an, in der die
> erstmals
> generierte Zufallszeichenfolge
> gespeichert wird,
> so daß jedesmal dieselbe
> eingegeben wird.
>
> Hat man genügend
> Ressourcen, verliert das
> reCAPTCHA-System das
> Vertrauen in die richtigen
> Eingaben der
> echten Nutzer und glaubt unsere
>
> zufallsgenerierten.
>
> Statt zufällig zu
> generieren, könnte man die
> falschen
> Zeichenfolgen auch aus einer Liste von
>
> Obszönitäten wählen, dadurch wird das ganze
>
> lustiger.
>
> Technisch wäre das sicherlich interessant.
>
> Da das System aber dazu genutzt wird, alte Bücher
> und Zeitungen zu digitalisieren, sollte man daran
> noch nicht mal denken.
>
Wieso? Sind alte Bücher und Zeitungen irgend etwas heiliges? Oder sind sie für die Freiheit oder die Unversehrtheit von irgendwelchen Menschen von Bedeutung?
Wäre zwar schon lame ein Forschungsprojekt zu sabotieren, aber der Schaden wäre rein wirtschaftlich.
Cobinja schrieb:
-------------------------------------------------------
> Sir Jective schrieb:
> --------------------------------------------------
> -----
> > Elysium schrieb:
>
> --------------------------------------------------
>
> -----
> > frage schrieb:
>
> --------------------------------------------------
>
> -----
> > von wo weis die
> software, ob
> die vom
> user
>
> eingegebenen buchstaben
> korrekt sind?
>
> (oder steht
> das im txt und
> ich habe
> es
> überlesen?)
>
> "But if a
>
> computer can't read such a CAPTCHA, how
>
> does
> the system know the correct answer to
> the
>
> puzzle? Here's how: Each new word
> that cannot
> be
> read correctly by OCR is
> given to a user
> in
> conjunction with
> another word for which
> the answer
> is
> already known. The user is then
> asked to
> read
> both words. If they solve the
> one
> for which the
> answer is known, the
> system
> assumes their answer
> is correct
> for the new
> one. The system then gives
>
> the new image to a
> number of other people
> to
> determine, with
> higher confidence,
> whether the
> original
> answer was
> correct."
>
> Auszug aus der
>
> offiziellen Webseite. Aber gute
> Frage,
> ging
> mir auch durch den Kopf.
>
> Man läßt (massenweise) selbst ein OCR über
> diese
> reCaptchas drüberlaufen. Man geht davon
> aus, daß
> im Großteil der Fälle das OCR ebenso
> intelligent
> ist, wie das von Carnegie Mellon.
> Beim erkannten
> Captcha gibt der Bot also die
> richtige
> Zeichenfolge ein, beim anderen
> irgendeine zufällig
> generierte.
>
> Zusätzlich legt man eine Datenbank für die
> nicht
> erkannten Captchas an, in der die
> erstmals
> generierte Zufallszeichenfolge
> gespeichert wird,
> so daß jedesmal dieselbe
> eingegeben wird.
>
> Hat man genügend
> Ressourcen, verliert das
> reCAPTCHA-System das
> Vertrauen in die richtigen
> Eingaben der
> echten Nutzer und glaubt unsere
>
> zufallsgenerierten.
>
> Statt zufällig zu
> generieren, könnte man die
> falschen
> Zeichenfolgen auch aus einer Liste von
>
> Obszönitäten wählen, dadurch wird das ganze
>
> lustiger.
>
> Technisch wäre das sicherlich interessant.
>
> Da das System aber dazu genutzt wird, alte Bücher
> und Zeitungen zu digitalisieren, sollte man daran
> noch nicht mal denken.
>
Und weil wir nicht mal daran denken sollten, tun das die "pösen Puben" nicht?
Gerade an sowas sollte ein Entwickler denken. Das (u.A.) macht m.E. einen guten Entwickler aus!
Sir Jective schrieb:
--------------------------------------------------------------------------------
> Wieso? Sind alte Bücher und Zeitungen irgend etwas heiliges? Oder sind sie
> für die Freiheit oder die Unversehrtheit von irgendwelchen Menschen von
> Bedeutung?
>
> Wäre zwar schon lame ein Forschungsprojekt zu sabotieren, aber der Schaden
> wäre rein wirtschaftlich.
>
"Rein wirtschaftlich".... was soll das denn sein? Klar, wenn in der dritten Welt das Geld fehlt für Medizin oder was zu essen, ist das natürlich auch ein "rein wirtschaftliches" Problem.
Kommentare: 173 | letzter Beitrag 27.05. 23:42
Kommentare: 94 | letzter Beitrag 26.05. 19:45
Kommentare: 83 | letzter Beitrag 02:00 Uhr
Kommentare: 72 | letzter Beitrag 02:56 Uhr
Kommentare: 66 | letzter Beitrag 02:26 Uhr
E-Mail an news@golem.de

T-Pod ist ein kleines Kraftwerk für unterwegs. Betrieben mit einer kleinen Kerze, erzeugt das Gerät Strom für eine Leselampe oder das Laden des Smartphone-Akkus.

Windows 8 kann auf entsprechender Hardware in weniger als 8 Sekunden booten. Dabei bleibt zu wenig Zeit, um den Bootvorgang zum Sprung ins Bios, ins UEFI-Menü oder in die Startauswahl von Windows zu unterbrechen.

Kim Schmitz will Zugriff auf seine 135 Computer und Festplatten, die die neuseeländischen Behörden im Januar 2012 beschlagnahmt haben. Das FBI halte das Material von der Justiz in Neuseeland zurück, um seine Verteidigung im Fall Megaupload zu erschweren, sagt er.

Renesas ist nach Elpida der zweite schwer angeschlagene japanische Chiphersteller. Renesas, das Hitachi, Mitsubishi Electric und NEC gehört, macht Verlust und will seine größte Fabrik verkaufen.

RIM soll in den kommenden Tagen erneut einen massiven Stellenabbau ankündigen. "Ich habe herausgefunden, welche Teile ich in meinem Puzzle nicht mehr benötige", sagte Firmenchef Thorsten Heins.

Ein britisches Blog will erfahren haben, dass Facebook den norwegischen Browserhersteller Opera Software kaufen will. Beide Unternehmen wollen sich dazu nicht äußern.