hur CAPTCHA fungerar | Constant Reader

vad är ?

du är säkert bekant med denna teknik, även om du inte riktigt vet namnet. står för helt automatiserad Offentlig Turing Test för att berätta datorer och människor isär. Dess mål är att kontrollera om en användare (av en app eller en webbplats) är en riktig person eller en bot. För att göra det, bygger det på specifika egenskaper som människor har och maskiner don ” t. det är allmänt används i webbbranschen som ett bra skydd mot spam, bots eller DOS-attacker.

Varför behöver vi?,

det finns många människor där ute som vill skada din webbplats, av olika skäl. Orättvis konkurrens, reklam, ibland skadligt beteende eller bara roligt. Du kan antyda att det inte är majoriteten av webbanvändare som försöker utnyttja systemets svagheter, men problemet kvarstår.

det enklaste exemplet är DOS (överbelastning), vilket är en typ av attack som är inriktad på att göra en resurs otillgänglig. Angriparen skickar en stor mängd förfrågningar till servern för att göra det oförmöget att returnera resultat. Det blockerar helt enkelt din webbplats., Att göra denna attack individuellt, av en riktig person, skulle vara en skräck. Det skulle vara tråkigt, ansträngande och helt enkelt omöjligt. Du kan inte manuellt göra den effektiva mängden förfrågningar, men datorer blir inte uttömda eller uttråkade. Det är inte ett problem för dem att göra hundratals förfrågningar varje… andra. hjälper dig att identifiera sådana beteenden och blockera dem.

ett annat exempel är skadlig annonseringstaktik. Varje Internetanvändare är bekant med spam. Du får massor av oönskade e-postmeddelanden varje dag. Det är lätt att blockera ett visst e-postmeddelande, men det är svårt att skydda mot okända., Om en spammare bara använder ett e-postkonto kan vi enkelt blockera det. Men föreställ dig nu att han / hon hyr en bot för att använda en av de fria e-postleverantörerna (den som inte använder ). På så sätt kan det skapa ett nytt konto var flera minuter och skicka spaminnehåll från de olika adresserna.

ett tredje exempel, mer triviala – kommentarer. Många webbplatser, även små bloggar, kämpar med oönskade annonser. Naturligtvis kan vi blunda för ett eller två skräppostmeddelanden. Tyvärr ser vi ofta hundratals av dem. Det är vanligt att hitta välskriven innehåll med en spammad kommentarsektion., Om du ser ett inlägg med hundratals av samma meddelande (inte riktigt relaterade till texten), ägaren förmodligen inte”t använda . Även för riktiga människor, men med onda avsikter (så kallade ”troll”) kan det vara en avskräckande barrikad.

hur fungerar det?

rötter går tillbaka till början av det tjugonde århundradet när Alan Turing ville svara på en fråga-kan datorer tänka som människor? Han satte upp ett spel av imitation, där en förhörsledare var skyldig att ställa två deltagarserier med frågor. Deltagarna var människor och maskiner., Förhörsledarens utmaning var att ta reda på vilken som var människan. Förhörsledaren kunde inte se eller höra dem och behövde bara förlita sig på svar. Om förhörsledaren inte kunde bestämma eller beslutat fel, maskinen klarat turingtestet. Målet är att ställa en sådan fråga eller att göra en sådan utmaning som datorer inte kan hantera. Samtidigt bör det vara lätt att svara för människor.

systemet är enkelt. Du skriver in vissa data eller utför någon annan åtgärd och sedan bekräfta det genom att klara ett test., Den vanligaste typen av test är en bild av en massa förvrängda bokstäver. Den använder frågan om datorer som inte kan tänka abstrakt och” se ” världen som människor gör. Medan människor är verkligen sofistikerade med bearbetning av visuella data, saknar datorer dessa färdigheter. När du tittar på bilden kan du snabbt läsa mönstret. Människans hjärna är konstruerad på ett sådant sätt att det alltid söker efter ett känt mönster eller form. Du vet paradoxen att se ansikten och former i träd, moln… även det är bara en illusion. Det kallas pareidolia.,

medan du enkelt kan läsa ovanstående ord och skriva ner dem, för datorer är det bara en massa nollor och sådana. Ändå måste vi komma ihåg hur maskiner fungerar. utmaningarna bör inte begränsas till ett fast antal. Om de skulle, skulle det vara lätt att lära en dator vilken text som motsvarar en given bild. Därför använder många skapare sofistikerade algoritmer för att generera sina förvrängda texter slumpmässigt. Skaparna av re räknat ut en annan idé. De använde processen för…, digitalisera böcker och bad användarna att dekryptera de korta bitarna.

på grund av de utvecklande botalgoritmerna har text-förvrängda S blivit mycket svårare att lösa. Titta bara på de två exemplen nedan.

medan den första är ganska läsbar kan den andra redan orsaka vissa problem.problem för någon utan skarp syn. Därför försökte många utvecklare att tänka på en ny typ av ., Resultatet av deras arbete var select-bilder .

det bygger på samma grund, men det är bara svårare att lösa för maskiner. Och vad är viktigare, det är lättare att lösa för människor.

systemet är enkelt. Du har en samling av bilder och måste välja de som matchar kraven. Det är lätt för dig att välja rätt. Datorer, dock Don ’t tänka som människor och det’ s inte så lätt för dem. Det bygger på ett klassiskt datorseende problem med bildmärkning., Det är också väldigt mobilvänligt. Det är lättare att trycka på bilder som motsvarar en ledtråd än att skriva en rad förvrängd text.

dessa tillvägagångssätt har sina nackdelar. För maskiner är de svåra att lösa, men textläsningssystem är också bara algoritmer. Således uppmuntrar de problem med att läsa s och behandlas som bots. För blinda och personer med olika ögon dysfunktioner orsakar det en teknisk barriär. Med detta i åtanke lägger utvecklare ofta till ljud-till sina text-snedvridande lösningar.,

det fungerar på ett liknande sätt. Skriptet lägger till ytterligare bakgrundsbrus till ljud för att göra det svårare för bots att lösa. Det har en liten inverkan på människor, men det lägger till många problem för röstigenkänningsprogram.

medan alla dessa lösningar är perfekta på papper, kan de fortfarande vara irriterande och förvirrande. Därför introducerade Google en ny (Ingen re) som bara ber dig att markera en ruta.,

exempel

Du har redan en del övergripande kunskaper om olika typer av . Nu vill jag berätta mer om den nyaste och mest populära lösningen-ingen re.

det skapades som ett resultat av den ganska uppenbara förverkligandet. Bots blev så avancerade att det nu är omöjligt att generera bilder som är lätta att lösa för människor men olösliga för dem. När spammare blir mer och mer sofistikerade blev bilderna svårare och svårare att läsa. Men Googles forskning visade att det är en återvändsgränd., Dagens AI-teknik kan lösa även de svåraste förvrängda texterna (nästan 99,8% noggrannhet).

så istället för att göra det svårare för människor, har de bestämt sig för att hitta ett sätt att göra en mer avancerad algoritm. Dess mål är att göra kontrollprocessen lätt för dig men fortfarande effektiv för att skydda mot robotar.

vi kan inte säga hur det verkligen fungerar i detalj, för – det är förståeligt-det är inte tillgängligt för allmänheten. Vad vi vet är att Google skapade sofistikerad analysteknik. Det försöker på något sätt gissa om du är en människa eller inte., Om den tror att du är, måste du bara markera en låda för att bevisa det.

det är enkelt, tillgängligt och inte irriterande. Om analysen inte är tillräckligt för att bestämma, ber systemet dig att lösa select-image . Om det fortfarande inte räcker, ber det dig att lösa en mer klassisk, men mycket svårare än gamla.

Okej, låt nu”s komma tillbaka för att analysera motorn bakom. Vi vet inte detaljerna, men låt oss försöka tänka på hur det kunde fungera., På GitHub kan du hitta en bra analys vilka steg re tar för att få allt att fungera. Kombinera det med papper ”jag är inte en människa: att Bryta Google re” (av Suphannee Sivakorn, Jason Polakis, och Angelos D. Keromytis), vi vet att skriften samlar minst information om:

Plugins
User-agent (den testar om det”s real)
genomförandetid, tidszon
Antalet klick/tangentbord/touch åtgärder i <iframe> av
Troliga cookies server-sida

och det…,

jämför miljö med beteendet hos många webbläsarspecifika funktioner och CSS-regler
kontrollerar rendering av kanfaselement.

även skärmupplösning och mushändelser spelar ingen roll. Vi använder olika enheter, vi använder tabletter (Det finns nästan inget musbeteende), så det verkar klokt. I papperet, du kan också läsa att hålla en cookie aktiv för + 9 dagar kan du passera re genom att bara klicka på kryssrutan.

är en säker lösning? För att bryta en helt, skulle du behöva försöka manipulera din dator att tänka på ett mänskligt sätt., Det är inte riktigt möjligt, men det finns några lösningar. Datorer försöker upptäcka texten åtminstone delvis och” gissa”vad” är resultatet eller använda sofistikerade algoritmer. Det är verkligen bra för dem att ha en databas med redan trasiga s sträng. Det finns webbplatser som även betalar sina användare för att lösa bilden s. Det verkar som om det kan vara till stor hjälp för bots i kampen med .

så länge människor vet om datorer svagheter, de kommer att prova olika metoder. De kommer att försöka ta itu med genom att minska dess komplexitet., En smart hacker skulle titta på genererade och analysera vad som gör dem så svårt att lösa. Finns det något i bakgrunden? Låt ” s leka med kontrast och bli av med medelvärden. Om du gör din bild svartvitt blir din utmaning mycket enklare. Om du tar hänsyn till tillräckligt många faktorer, kommer du att kunna bygga en riktigt fungerande algoritm.

ingen trodde att bilden alltid skulle vara säker och det var en tidsfråga att det skulle vara knäckt och… det var det redan. Under en lång tid, Google image re system verkade som ett säkert val., Tyvärr lärde forskare redan maskinen att gissa rätt svar. Vid 70.78 procent noggrannhet, som de spelade in. Det är ett bra resultat, med en genomsnittlig tid för att lösa mindre än 20 sekunder. Facebook-systemet misslyckades ännu värre med 83.5% av framgångsfrekvensen.

många bildsystem misslyckades mot avancerade algoritmer. Jennifer Tam, Jiri Simsa, Sean Hyde, och Luis von Ahn (som alla arbetar för Carnegie Mellon University, Pittsburgh) ville ta reda på om det var lätt att lura ljud också. De lyckades med några av dem., Under våren 2012 fanns det rapporter om att Googles ljudsystem hade brutits med en 99% framgång. Ingenjörerna gjorde ett litet förbiseende. Bullerbakgrunden (huvudskyddet) använde inte högfrekventa ljud. Det gjorde det enkelt för hackare att isolera varje ord genom att lokalisera regionerna med högre frekvenser.

och vad sägs om den nyaste lösningen-ingen re? Denna teknik kan verka svårare att knäcka men är inte okrossbar. Detta år säkerhetsexperter från Columbia University har distribuerat en attack teknik mot Facebook och Google är inget nytt. De lyckas med 41.,57 procent framgång (vid ca 20 sekunder per utmaning). Det är mindre än 50%, men det är tillräckligt för bots för att göra din webbplats spammad. De kan bombardera dig med hundratals förfrågningar per minut trots allt. Hur knäckte de det? De skapade sin egen sofistikerade re-breaking algoritm och jämförde den med andra tillgängliga brytare. Tack vare att de ” har distribuerat en balanserad lösning. De har uppnått sådan framgång i offline-läge. Så, vi kan anta att en hel del ingen re ström kommer från att analysera användarhistorik, otillgänglig utan Internet-anslutning.,

nackdelar med

används ofta och det kan vara riktigt irriterande. Låt oss vara ärliga-att skriva några konstigt formade bokstäver eller lösa andra typer av utmaningar om och om igen är helt enkelt irriterande. Ok, vi vet varför utvecklare använder den. Ändå ser det ut som om de”försöker skaka av sig sitt ansvar och göra det till ditt. Genom att säga det skulle du delvis ha rätt. Det finns en del sanning i det, men det är verkligen svårt att hitta ett annat sätt att göra det. Du kan prova några sofistikerade algoritmer, men i de flesta fall är det lätt att lura dem.

ett annat problem – tillgänglighet., Även om du har stora ögon kan du möta problem ibland. Att identifiera en giltig text eller bild (select-image s) är inte alltid en enkel sak. Och vad händer om din vision är lite suddig eller om du har någon form av ögondysfunktion? Ljudversionen verkar vara en perfekt lösning, men den har ofta dålig kvalitet. Och vad händer om du använder text-bara webbläsare eller inte har ett ljudkort installerat?

förbrukar också din tid. Man kan säga att det bara tar 2,3 sekunder men nu föreställa sig att varje webbplats använder den. Hur många av dem besöker du en dag?, Hur många åtgärder kan en webbplats be dig att utföra för att verifiera din mänsklighet?

a kan skada din webbplats användbarhet och tillgänglighet. Även om den nya re gjort av Google behandlar väl med det, inte alla system är så bra på det.

slutsats

det verkar att det inte finns någon perfekt lösning. Med varje ny generation av, det finns nya generationer av robotar. Ju mer sofistikerade algoritmer du använder för att skydda mot dem, desto klokare blir de. Men betyder det att det är helt oanvändbart och bara irriterar användarna? Nej, tanken är fortfarande bra., Även enkla s representerar en betydande barriär för de flesta primitiva bots. Vi bör ” t beröva det men observera att inte skydda dig och/eller dina användare om data/referenser läckage, som kan utlösas av någon tredje part skript som ingår i sidan, webbläsartillägg eller en MitB trojan.

vill du veta mer? Här är några användbara länkar:

’s mål

vad är syftet med tekniken?,

bryta

Google Re knäckt i ny automatiserad Attack
Stanford forskare spricka kod
bryta ljud s
läs hur en trio av hackare förde Googles ljud re till knäna
forskare utarbetat en re bryta systemet effektivt mot Google och Facebook
re är fortfarande sårbar – kanske ännu mer än någonsin tidigare

hur Googles ingen re arbete?

hur fungerar nytt Google re?
Hur fungerar Google”s ”No re”?,
ingen re utmaning

tillgänglighet

kampanj för att döda sparkar
hur Google ” s re behandlar tillgänglighet?