Hvordan CAPTCHA Fungerer | Constant Reader

Hva er det ?

Du er sikkert kjent med denne teknologien, selv om du don»t kjenner navnet. står for Fullstendig Automatisert Offentlig Turing Test å Fortelle Datamaskiner og Mennesker fra Hverandre. Dens mål er å sjekke om en bruker (i en app eller et nettsted) er en ekte person eller en bot. For å gjøre det, det er avhengig av spesifikke egenskaper som folk har og maskiner don»t. Det er mye brukt i web-bransjen som en god beskyttelse mot spam, bots eller DOS-angrep.

Hvorfor trenger vi ?,

Det finnes mange mennesker der ute som ønsker å skade ditt nettsted, av forskjellige grunner. Urettferdig konkurranse, reklame, noen ganger ondsinnet atferd eller bare for moro. Kan du antyde det er ikke flertallet av internett-brukere som prøver å utnytte systemets svakheter, men problemet gjenstår.

Den enkleste eksempel er DOS (Denial of Service), som er en type angrep som er fokusert på å gjøre en ressurs utilgjengelig. Angriperen sender en stor mengde forespørsler til serveren for å gjøre den i stand til å gi resultater. Det rett og slett blokkerer din nettside., Gjør dette angrepet individuelt, med en ekte person, ville være en horror. Det ville være kjedelig, slitsomt og ganske enkelt umulig. Du kan»t manuelt lage den effektive mengden av forespørsler, men datamaskiner don»t bli utslitt eller lei. Det er ikke et problem for dem å lage hundrevis av henvendelser hver… andre. hjelper deg med å identifisere en slik atferd og blokkere dem.

et Annet eksempel er skadelig reklame taktikk. Hver internett-bruker er kjent med spam. Du får tonnevis av uønskede e-poster hver dag. Det er lett å blokkere en bestemt e-post, men det er vanskelig å beskytte mot ukjente seg., Hvis en spammer bruker bare én e-postkonto, kan vi lett blokkere det. Men tenk deg nå at han/hun leier en bot for å bruke en av de gratis e-postleverandører (den som doesn»t bruk ). På den måten, det kan sette opp en ny konto hver flere minutter og sende spam innhold fra forskjellige adresser.

Et tredje eksempel, mer trivielle – kommentarer. En rekke nettsteder, selv små blogger, kjemper med uønsket reklame. Selvfølgelig, vi kan slå et blindt øye på ett eller to spam-meldinger. Dessverre, vi ofte se hundrevis av dem. Det er vanlig å finne godt skrevet innhold med en spammet kommentarfeltet., Hvis du ser et innlegg med hundrevis av den samme meldingen (ikke egentlig knyttet til tekst), eier sannsynligvis doesn»t bruk . Selv for ekte mennesker, men med onde hensikter (såkalte «troll»), kan det være en nedslående barrikaden.

Hvordan fungerer det?

røtter går tilbake til begynnelsen av det tjuende århundre, da Alan Turing ønsket å svare på ett spørsmål – datamaskiner Er i stand til å tenke som mennesker? Han satte opp et spill av imitasjon, hvor han som forhører seg en var forpliktet til å stille to deltakere rekke spørsmål. Deltakerne var mennesker og maskiner., Det han som forhører seg»s utfordring var å finne ut hvilken som var den menneskelige vesen. Det var han som forhører seg ute av stand til å se eller høre dem, og trengte å stole bare på svar. Hvis det var han som forhører seg ute av stand til å bestemme eller besluttet feil, maskinen bestått Turing test. Målet er å stille slike spørsmål, eller for å gjøre en slik utfordring at datamaskiner er i stand til å håndtere. På samme tid, bør det være enkelt å besvare for mennesker.

ordningen er enkel. Du kan skrive inn data eller utføre enhver annen handling, og bekreft det ved å sende en test., Den mest vanlige type test er et bilde av en haug med forvridde tegn. Den bruker utstedelse av datamaskiner ikke er i stand til å tenke abstrakt og «se» verden slik mennesker gjør. Mens mennesker er veldig sofistikert med behandling av visuelle data, datamaskiner mangler disse ferdighetene. Når du ser på bildet, kan du raskt lese mønster. Hjernen til mennesker er konstruert på en slik måte at det er alltid søker etter et kjent mønster eller form. Du vet paradokset av å se ansikter og figurer i trær, skyer… selv det er bare en illusjon. Det»s kalt pareidolia.,

Mens du er lett i stand til å lese over ord og skrive dem ned, for datamaskiner det er bare en masse av nuller og enere. Likevel må vi huske hvordan maskiner virker. ‘s utfordringer bør»t være begrenset til et fast antall. Hvis de ville, ville det være lett å lære en datamaskin som tekst tilsvarer et gitt bilde. Derfor er det mange skaperne bruker avanserte algoritmer for å generere sine forvrengte tekster tilfeldig. Skaperne av re funnet ut en annen idé. De brukte prosessen…, digitalizing bøker og spurte brukere til å dekryptere den korte stykker.

på Grunn av den økende bot algoritmer, tekst-forvrengt S har blitt mye vanskeligere å løse. Bare se på to eksempler nedenfor.

Mens den første er ganske lesbar, det andre man kunne allerede føre til noen problemer for noen uten et skarpt syn. Derfor, mange av utviklerne prøvde å tenke ut en ny type ., Resultatet av deres arbeid var velg-bilder .

Det baserer seg på det samme grunnlaget, men det er bare vanskeligere å løse for maskiner. Og hva»s mer viktig, det er enklere å løse for mennesker.

ordningen er enkel. Du har en samling av bilder, og du må plukke dem som samsvarer med kravene. Det er lett for deg å velge riktig. Datamaskiner, men don»t tenke som mennesker, og det er ikke så lett for dem. Det baserer seg på en klassisk computer vision problemet med bilde merking., Også, det er virkelig mobil-vennlig. Det er lettere å trykke bilder som er tilknyttet med en anelse enn å skrive en linje av forvrengt tekst.

Disse tilnærmingene har sine ulemper. For maskiner, de er vanskelige å løse, men tekst-leser-systemer er også bare algoritmer. Dermed, de oppfordrer problemer med å lese s og er behandlet som roboter. For blinde og personer med ulike øyne dysfunksjoner, fører det til en teknologisk barriere. Med det i tankene, utviklere ofte du vil legge til lyd – til sin tekst-vri løsninger.,

Det fungerer på en lignende måte. Skriptet legger til ekstra bakgrunnsstøy til lyd for å gjøre det vanskeligere for roboter til å løse. Det har liten innvirkning på mennesker, men det gir en rekke problemer for stemme-anerkjennelse programmer.

Mens alle disse løsningene er perfekt på papir, kan de likevel være irriterende og forvirrende. Derfor, Google introduserte en ny (Ikke re) som ber deg bare å krysse av i en boks.,

Eksempel

Du har allerede noen generelle kunnskap om ulike typer . Nå ønsker jeg å fortelle dere mer om den nyeste og mest populære løsning – ikke noe nytt.

Det ble opprettet som et resultat av ganske åpenbart realisering. Bots fikk så avansert at det er nå umulig å generere bilder som er lett å løse for mennesker, men uløselige for dem. Som spammere blir mer og mer sofistikerte, bilder fikk vanskeligere og vanskeligere å lese. Men Google»s forskning viste at det er en blindvei., Dagens AI teknologi kan løse selv de vanskeligste forvrengt tekster (nesten 99.8% nøyaktighet).

Så i stedet for å gjøre det vanskeligere for mennesker, de»ve bestemte seg for å finne en måte å gjøre en mer avansert algoritme. Målet er å gjøre kontrollere prosessen enklere for deg, men fortsatt er effektive for å beskytte mot boter.

Vi kan»t si hvordan det egentlig fungerer i detalj, fordi – det er forståelig – det er ikke tilgjengelig for publikum. Det vi vet er at Google har laget sofistikerte å analysere teknologi. Det er noe forsøker å gjette hvis du»re et menneske eller ikke., Hvis den tror du er, du bare nødt til å krysse av i en boks for å bevise det.

Det er enkelt, tilgjengelig og ikke irriterende. Hvis analyse isn t nok til å avgjøre, systemet ber deg om å løse velg-bilde . Hvis det er likevel ikke nok, det ber deg om å løse en mer klassisk , men mye vanskeligere enn de gamle.

Ok, nå la»s komme tilbake til å analysere motor bak. Vi don»t kjenner detaljene, men let’ s prøve å tenke hvordan kan det fungere., På GitHub du kan finne en god analyse av hvilke tiltak re som trengs for å gjøre det hele fungerer. Kombinere det med papir «jeg er ikke et menneske: å Bryte Google re» (ved Suphannee Sivakorn, Jason Polakis, og Angelos D. Keromytis), vet vi at skriptet samler minst informasjon om:

Plugins
User-agent (den tester om det er ekte)
lang tid, tidssone
Antall klikk/tastatur/touch handlinger i <iframe> av
Sannsynlig cookies server-side

og det…,

sammenligner miljø med oppførselen til mange nettleser-spesifikke funksjoner og CSS-regler
kontroller gjengivelse av lerret elementer.

Også, skjermoppløsning og mus hendelser don»t virkelig betyr noe. Vi bruker ulike enheter, kan vi bruke tabletter (det er nesten ingen mus atferd), så det virker klok. I papir, kan du også lese at det å holde en cookie aktivt for +9 dager kan du passere på nytt ved å bare klikke i avmerkingsruten.

Er en sikker løsning? For å bryte en helt, du ville ha til å prøve å manipulere datamaskinen til å tenke på en human måte., Det er egentlig ikke mulig, men det er noen løsninger. Datamaskiner prøve å gjenkjenne tekst i det minste delvis, og «gjette» hva»s resultatet eller bruker avanserte algoritmer. Det er veldig nyttig for dem å ha en database av allerede brutt s strengen. Det finnes nettsteder som selv betaler sine brukere for å løse bilde s. Det ser ut til at det kan være veldig nyttig for roboter i kampen med .

Så lenge folk vet om datamaskiner svakheter, de vil prøve ulike tilnærminger. De vil prøve å takle ved å redusere kompleksiteten., En smart hacker ville se på genererte og analysere hva som gjør dem så vanskelig å løse. Er det noe i bakgrunnen? Let ‘ s play med kontrast og kvitte seg med midt-verdier. Hvis du gjør bildet sort / hvitt, din utfordring vil være mye enklere. Hvis du vil ta med i betraktning nok mengde faktorer, du vil være i stand til å bygge en virkelig fungerer-algoritmen.

Ingen trodde at bildet alltid ville være trygt, og det var et spørsmål om tid at det ville være sprukket og… det allerede var. For en lang tid, Google image re systemet virket som et trygt valg., Dessverre, forskere allerede lært maskinen til å gjette det riktige svaret. På 70.78 prosent nøyaktighet, som de har spilt inn. Det er et flott resultat, med en gjennomsnittlig tid på å løse mindre enn 20 sekunder. Den Facebook-system mislyktes enda verre med 83.5% suksess rate.

mye av bildet systemer mislyktes mot avanserte algoritmer. Jennifer Tam, Jiri Simsa, Sean Hyde, og Luis von Ahn (som alle jobber for Carnegie Mellon University i Pittsburgh) ønsket å finne ut om det var lett å lure lyd, så vel. De lyktes med noen av dem., I løpet av våren 2012, var det rapporter om at Google»s audio system hadde blitt knust med en 99% suksess rate. Ingeniører laget en liten oversikt. Støy bakgrunn (den viktigste beskyttelse) didn»t bruker høyfrekvente lyder. Det gjorde det enkelt for hackere å isolere hvert ord ved å finne områder med høyere frekvenser.

Og hva om de nyeste løsning – ingen re? Denne teknikken kan virke vanskeligere å knekke, men er ikke uknuselige. Dette året sikkerhet eksperter fra Columbia University har utplassert et angrep teknikk mot Facebook og Google ikke noe nytt. De lykkes med 41.,57 prosent suksess rate (omtrent 20 sekunder per utfordringen). Det er mindre enn 50%, men det er nok for roboter å gjøre nettstedet ditt spammet. De kan bombardere deg med hundrevis av forespørsler per minutt etter alle. Hvordan gjorde de knekke den? De skapte sin egen sofistikerte re-breaking-algoritme, og sammenliknet det med andre tilgjengelige -breakers. Takket være at de»har utplassert en balansert løsning. De»har oppnådd en slik suksess mens du er i frakoblet modus. Så vi kan anta at mye av ingen ny kraft kommer fra å analysere brukerens historie, utilgjengelige uten internett-tilkobling.,

Ulemper med

er mye brukt, og det kan være veldig irriterende. La s være ærlig – å skrive litt merkelig formet bokstavene eller løse andre typer av utfordringer over og over er rett og slett irriterende. Ok, vi vet hvorfor utviklere bruke det. Likevel, det ser ut som de»re prøver å riste av seg sitt ansvar bevisst og gjør det til ditt eget. Ved å si at du ville være delvis rett. Det er noe sannhet i det, men det er veldig vanskelig å finne en annen måte å gjøre det på. Du kan prøve noen avanserte algoritmer, men i de fleste tilfeller, det er lett å lure dem.

et Annet problem – tilgjengelighet., Selv om du har store øyne, kan du problemer noen ganger. Å identifisere en gyldig teksten eller bildet (velg-bilde S) isn t alltid en enkel ting. Og hva hvis synet ditt er litt uklart eller du har noen form for øye dysfunksjon? Lyden versjonen virker som en perfekt løsning, men det har ofte dårlig kvalitet. Og hva hvis du bruker tekst-bare nettlesere eller don»t har installert et lydkort?

også bruker tiden din. Du kan si det tar bare 2,3 sekunder, men nå tenk deg at hver nettsiden bruker det. Hvor mange av dem gjør du besøker en dag?, Hvor mange handlinger kan et webområde ber deg om å utføre for å verifisere din menneskeheten?

En kan skade ditt nettsted brukervennlighet og tilgjengelighet. Selv om den nye re laget av Google hotelltilbud godt med det, ikke hver systemet er så god til det.

Konklusjon

det virker som om Det er ingen perfekt løsning. Med hver ny generasjon av , er det nye generasjoner av roboter. De mer sofistikerte algoritmer du bruker for å beskytte mot dem, jo bedre blir de. Men betyr det er helt unuseful og bare irriterer brukerne? Nei, ideen er fortsatt god., Selv enkle s representerer en betydelig barriere for de fleste primitive roboter. Vi bør»t frata av det, men vær oppmerksom på at ikke beskytte deg og/eller dine brukere om data/legitimasjon lekkasje, som kan være utløst av en tredje-part skript inkludert i side, utvidelser eller en MitB trojan.

vil du vite mer? Her er noen nyttige lenker:

‘s mål

Hva er hensikten med teknologi?,

å Bryte

Google re Sprakk i Nye Automatiserte Angrep
Stanford Forskere Knekke Koden
Bryte Audio s
Les hvordan en trio av hackere brakt Google ‘ s audio re til sine knær
Forskere utviklet et nytt bremsesystem effektiv mot Google og Facebook
Re er fortsatt sårbare, kanskje enda mer enn noen gang før

Hvordan fungerer Google er ingen ny jobb?

Hvordan blir nye Google re arbeid?
Hvordan fungerer Google»s «Ingen ny» jobb?,
Ingen ny utfordring

tilgjengelighet

Kampanje for å drepe kicks off
Hvordan Google»s re avtaler med tilgjengelighet?