Ausschalten eines visuellen CAPTCHA

Ausschalten eines visuellen CAPTCHA
Copyright © Simon Fraser University
For original English text, go to: http://www.cs.sfu.ca
Translated by A.Romanova

Greg Mori (1,2) und Jitendra Malik (1)
(1) UC Berkeley Computer Vision Group
(2) Simon Fraser Universität

Zusammenfassung

Das ist die Hauptseite von Shape Contexts basierte Methode, Gimpy auszuschalten, der CAPTCHA-Test wird auf Yahoo! verwendet, um Bots auszusortieren. Unsere Methode kann diesem Test 92 % der Zeit erfolgreich bestehen. Die Methode wir annehmen, verwendet allgemeine Zweck-Algorithmen, die für die allgemeine Gegenstand-Anerkennung entworfen worden sind. Dieselben Grundideen sind auf die Entdeckung von Leuten in Images, das Zusammenbringen handschriftlicher Ziffern und Erkennen von 3D-Gegenständen angewandt worden.

Nachrichtenartikel

Human or Computer? Take This Test, The New York Times am 10. Dezember 2002.

Up to the Challenge: Computer Scientists Crack a Set of AI-Based Puzzles, SIAM News, November 2002.

Schnelle Links:

Hintergrund
Unsere Vorgehensweisen
Ergebnisse
Zusammenhängende Links

Bild eines CAPTCHA im Verwendung an Yahoo.

Hintergrund

CAPTCHA ist ein Programm, das Tests erzeugen un schaffen kann, die:

  • Die meisten Menschen können das bestehen, ABER
  • Aktuelle Computerprogramme können das nicht gehen

CAPTCHA tritt für “Completely Automated Public Turing test to Tell Computers and Humans Apart ” ein. Sieh die CAPTCHA Seite für mehr Details darüber. Das CAPTCHA Konzept wird durch reale Probleme begründet, die von Internetgesellschaften wie Yahoo! und AltaVista angesehen sind. Diese Gesellschaften bieten kostenlose E-Mail-Konten an, beabsichtigt für den menschlichen Gebrauch. Jedoch haben sie gefunden, dass viele Online-Verkäufer “Bots”, Computerprogramme verwendet hatten, die sich für Tausende von E-Mail-Konten anmelden würden, von denen sie Massen der Junk-Mail verbreiten konnten. Durch die Forderung der Benutzer ein CAPTCHA zu lösen, im Fall von Yahoo basierten auf einem Wort, genannt EZ-GIMPY, wie oben gezeigt wurde, könnte “Bots” untersucht sein.

EZ-Gimpy und Gimpy, CAPTCHAs, den wir gebrochen haben, sind Beispiele von wortbasiertem CAPTCHAs. In EZ-Gimpy, CATPCHA verwendet durch Yahoo! (gezeigt in der Abbildung oben), dem Benutzer wird ein Bild von einem einzelnen Wort dargestellt. Dieses Image ist verzerrt und übergeladen worden, strukturierter Hintergrund ist hinzugefügt worden. Die Verzerrung und das Durcheinander sind genügend um aktuelle OCR (optische Charakter-Anerkennung) Software zu verwechseln. Jedoch mit unseren Computervisionstechniken sind wir im Stande, das Wort 92 % der Zeit richtig zu identifizieren.

Gimpy ist eine schwierigere Variante eines wortbasierten CAPTCHA. Zehn Wörter werden in der Verzerrung und Durcheinander präsentiert, ähnlich mit EZ-Gimpy. Die Wörter werden auch übergegriffen, besorgen einen CAPTCHA-Test, der für Menschen in einigen Fällen anspruchsvoll sein kann. Der Benutzer wird verlangt von 3 bis 10 Wörter im Image nennen, um den Test zu bestehen. Unser Algorithmus kann diesem schwierigeren Test 33 % der Zeit passieren.

Unsere Vorgehensweisen

Die grundsätzlichen Ideen verantwortlich für unsere Vorgehensweisen Gimpy zu lösen, sind dasselbe als diejenigen wir verwenden, um allgemeine Gegenstand-Anerkennungsprobleme zu beheben. Unsere Auflösung zum Gimpy CAPTCHA ist gerade eine Anwendung eines allgemeinen Fachwerks, dass wir gepflegt haben, Images von täglichen Gegenständen zu vergleichen und sogar Leute in Videofolgen zu finden und zu verfolgen. Die Essenzen dieser Probleme sind ähnlich. Die Entdeckung von Buchstaben “T”, “A”, “M”, “E” in einem Bild und sie zu verbinden für Lesen des Wortes “TAME”, ist ähnlich mit der Entdeckung von Händen, Füßen, Ellbogen und Gesichten, und verbinden sie bis dazu einen Mensch zu finden. Echte Images von Leuten und Gegenständen enthalten große Beträge des Clutters. Man lernt sich mit der gegnerischen Clutter zu befassen, anwesend bei Gimpy, hat uns im Verstehen allgemeiner Gegenstand-Anerkennungsprobleme geholfen.

Unsere zusammenhängende Arbeit an der Entdeckung von Leuten und allgemeinen Gegenständen.

Eine Hochbeschreibung der unserer Methode kann hier gefunden werden.

Wenn Sie mehr Details darüber möchten, siehe unsere Arbeit aus CVPR 2003.

Ergebnisse

EZ-Gimpy

Unten gibt es einige Beispiele von analysierten Images, verwendend unsere Methode und das gefundene Wort. Richtige Wörter werden in Grünen, falschen Wörtern im Rot gezeigt. Für EZ-Gimpy haben wir Versuche mit 191 Images angestellt. Wir sind im Stande gewesen, das Wort in 176 dieser Images richtig zu identifizieren: eine Erfolg-Rate von 92 %! Unser Algorithmus bringt nur ein paar Sekunden, um ein Image zu bearbeiten. Wenn Ihr gern hätten, unsere Ergebnisse auf allen 191 Images zu sehen, klicken Sie bitte hier.

POLISH                    SPACE

JOIN                  AGAIN

FLAG                 CANVAS

PORTER                  MINE

HORSE                  JEWEL

WEIGHT               SOUND

RICE                     SOCK

Die schwierigere Version des Gimpy CAPTCHA präsentiert ein Image solcher als ein, wie unten gezeigt wird. Es gibt 10 Wörter (einige wiederholt), überzogen in Paaren. Der Testnehmer ist erforderlich, um 3 Wörter dargestellten im Image zu verzeichnen, um dazu zu bestehen.

Clutter in diesen Bilder, echten Wörtern statt zufälliger Hintergrundtexturen, ist viel schwieriger sich zu befassen. Außerdem müssen wir 3 Wörter statt gerade ein finden. Unser aktueller Algorithmus kann 3 richtige Wörter finden und bestehen Gimpy-Test 33 % der Zeit. Bemerkung: selbst wenn wir ein einzelnes Wort richtig 70 % der Zeit erraten konnten, wir würden nur annehmen, um 3 Wörter richtig etwa 0.7*0.7*0.7 = 34 % der Zeit zu bekommen. Außerdem, in Anbetracht unserer 33-%-Erfolg-Rate, würde dieser CATPCHA noch beim Herausfiltern von “Bots” unwirksam sein, da sie ein Programm mit Tausenden von Bitten bombardieren können.

Der Algorithmus, den wir verwenden, wird im Detail in unserer Arbeit entworfen, die oben verbunden ist. Überprüfen Sie unsere Ergebnisse auf die härtere Version von Gimpy.

Links

CAPTCHA Projekt
NuCaptcha, ein neuer Videobasierter CAPTCHA Service Greg Mori ist empfohlen
The UC Berkeley Computer Vision Group
The SFU Vision and Media Lab

Zurück nach Greg Moris Seite