Sådan fungerer CAPTCHA’er Hvad betyder CAPTCHA?
Hvad er en?
En test er designet til at afgøre, om en onlinebruger virkelig er et menneske og ikke en bot. er et akronym, der står for “Completely Automated Public Turing test to tell Computers and Humans Apart.” Brugere støder ofte på og re-tests på Internettet. Sådanne tests er en måde at styre botaktivitet på, selvom tilgangen har sine ulemper.
Selvom s er designet til at blokere automatiserede bots, er de selv automatiserede. De er programmeret til at dukke op visse steder på et websted, og de videregiver eller mislykkes automatisk brugere.
Hvordan fungerer et arbejde?
Klassiske s, som stadig er i brug på nogle webegenskaber i dag involverer at bede brugerne om at identificere bogstaver. Bogstaverne er forvrængede, så bots sandsynligvis ikke er i stand til at identificere dem. For at bestå testen skal brugerne fortolke den forvrængede tekst, indtaste de korrekte bogstaver i et formfelt , og indsend formularen. Hvis bogstaverne ikke stemmer overens, bliver brugerne bedt om at prøve igen. Sådanne tests er almindelige i loginformularer, kontotilmeldingsformularer, online afstemninger og e-handels-kassesider.
Ideen er, at et computerprogram som f.eks. en bot vil ikke være i stand til at fortolke de forvrængede bogstaver, mens et menneske, der er vant til at se og fortolke bogstaver i alle mulige sammenhænge – forskellige skrifttyper, forskellige håndskrifter osv. – normalt vil være i stand til at identificere dem.
Det bedste, som mange bots vil være i stand til, er at indtaste nogle tilfældige bogstaver, hvilket gør det statistisk usandsynligt, at de vil bestå testen. Således mislykkes bots testen og er blokeret fra at interagere med hjemmesiden eller applikationen, mens mennesker er i stand til at fortsætte med at bruge den som normalt.
Avancerede bots er i stand til at bruge maskinlæring til at identificere disse forvrængede bogstaver, så denne type tests erstattes med mere komplekse tests. Google re har udviklet en række andre tests til at sortere menneskelige brugere fra bots.
Hvad er re?
re er en gratis tjeneste, som Google tilbyder som erstatning for traditionelle s. re-teknologi blev udviklet af forskere ved Carnegie Mellon University og derefter erhvervet af Google i 2009.
re er mere avanceret end de typiske tests. Ligesom nogle res kræver brugere at indtaste billeder af tekst, som computere har problemer med at dechifrere. I modsætning til almindelige s kilder du teksten fra billeder fra den virkelige verden: billeder af gadeadresser, tekst fra trykte bøger, tekst fra gamle aviser osv.
Over tid har Google udvidet funktionaliteten af gentest, så de ikke længere behøver at stole på den gamle stil til at identificere sløret eller forvrænget tekst. Andre typer gentest omfatter:
- Billedgenkendelse
- Afkrydsningsfelt
- Generel vurdering af brugeradfærd (slet ingen brugerinteraktion)
Hvordan fungerer en billedgenkendelsestest?
For en billedgenkendelsestest får brugerne typisk 9 eller 16 kvadratiske billeder. Billederne kan alle være fra det samme store billede, eller de kan hver være forskellige. En bruger skal identificere de billeder, der indeholder bestemte objekter, såsom dyr, træer eller gadeskilte. Hvis deres svar svarer til svarene fra de fleste andre brugere, der har indsendt den samme test, betragtes svaret som “korrekt”, og brugeren består testen.
At vælge bestemte objekter fra slørede fotos er et svært problem for computere at løse. Selv avancerede kunstige intelligensprogrammer (AI) kæmper med det – så en bot vil også kæmpe med det. En menneskelig bruger skal dog være i stand til at gøre dette ret let, da mennesker er vant til at opfatte hverdagsgenstande i alle mulige sammenhænge og situationer.
Hvordan fungerer gentest med et enkelt afkrydsningsfelt?
Nogle gentest kræver simpelthen brugeren til at markere et afkrydsningsfelt ud for udsagnet, “Jeg er ikke en robot.” Testen er imidlertid ikke den egentlige handling ved at klikke på afkrydsningsfeltet – det er alt, der fører op til klik på afkrydsningsfeltet.
Denne gentest tager højde for bevægelsen af brugerens markør, når den nærmer sig afkrydsningsfeltet. Selv den mest direkte bevægelse med en mennesket har en vis mængde tilfældighed på det mikroskopiske niveau: små ubevidste bevægelser, som bots ikke let kan efterligne. Hvis markørens bevægelse indeholder noget af denne uforudsigelighed, beslutter testen, at brugeren sandsynligvis er legitim. Re kan også vurdere de cookies, der er gemt af browseren på en brugerenhed, og enhedens historie for at fortælle, om bruger sandsynligvis er en bot.
Hvis testen stadig ikke er i stand til at afgøre, om brugeren er et menneske eller ej, kan det udgøre en yderligere udfordring, såsom billedgenkendelsestesten beskrevet ovenfor. Men det meste af tiden er brugerens markørbevægelser, cookies og enhedshistorik afgørende nok.
Hvordan fungerer re uden brugerinteraktion?
De nyeste versioner af re er i stand til at tage et helhedsorienteret blik på en brugers adfærd og historie med at interagere med indhold på Internettet. Det meste af tiden kan programmet beslutte ud fra disse faktorer, om eller ikke brugeren er en bot uden at give brugeren en udfordring, der skal udføres. Hvis ikke, får brugeren en typisk genudfordring.
Hvad udløser en test?
Nogle webegenskaber har bare automatisk s på plads som et proaktivt forsvar mod bots. Andre gange kan en test udløses, hvis brugeradfærd ser ud til at ligne en bots adfærd: hvis brugerne anmoder om websider eller klikker på hyperlinks med en langt højere hastighed end gennemsnittet, for eksempel.
Er s og res nok til at stoppe ondsindede bots?
Nogle bots kan komme forbi tekst s på egen hånd. Forskere har demonstreret måder at skrive et program, der også slår billedgenkendelsens. Derudover kan angribere bruge klikbedrifter til at slå prøverne: tusinder af lavtlønnede arbejdere, der løser s på vegne af bots.
Udover a skal der være andre strategier til at stoppe uønskede bots (f.eks. som indholdsskrabende bots, legitimationsudfyldningsbots eller spam-bots).
Hvad er ulemperne ved at bruge s eller res til at stoppe bots?
Dårlig brugeroplevelse: En test kan afbryde strøm af, hvad brugerne prøver at gøre, hvilket giver dem et negativt overblik over deres oplevelse på webejendom og fører til, at de i nogle tilfælde helt opgiver websiden.
Ikke anvendelig for synshandicappede: Problemet med s er, at de stoler på visuel opfattelse. Dette gør dem næsten umulige, ikke kun for personer, der er juridisk blinde, men for alle med alvorligt nedsat syn.
Disse tests kan narre af bots: Som beskrevet ovenfor er s ikke fuldt bot-beviste og burde der ikke være tillid til botadministration.
Er der alternativer til at bruge s eller res?
Botadministrationsløsninger såsom Cloudflare Bot Management kan identificere dårlige bots uden at påvirke brugeroplevelsen. , baseret på botens adfærd. På denne måde kan bots mildnes uden at tvinge brugerne til at gennemføre s.
Hvordan er og er relateret til kunstig intelligens (AI) -projekter?
Da millioner af brugere identificerer svær at læse tekst og vælger objekter i slørede billeder, føres disse data ind i AI-computerprogrammer, så de også bliver bedre til disse opgaver.
Generelt er computerprogrammer kæmper med at identificere objekter og bogstaver i forskellige sammenhænge, fordi kontekst kan ændre sig uendeligt i den virkelige verden. For eksempel et stopskilt er en rød ottekant med hvide bogstaver, der læser “STOP.” Et computerprogram kunne identificere en form-og-ord-kombination sådan ret let. Et stopskilt på et foto kan dog se meget anderledes ud end den enkle beskrivelse afhængigt af konteksten: vinklen på billedet, belysningen, det involverede vejr osv.
Via maskinindlæring, AI-programmer kan blive bedre til at overvinde disse begrænsninger. For eksempel på stopskilt, ville programmøren give AI-programmet en masse data om, hvad der er og ikke er et stopskilt. For at dette skal være effektivt, har de brug for mange eksempler på billeder med stopskilt og billeder uden stopskilt, og de har brug for menneskelige brugere til at identificere dem, indtil programmet har nok data til at være effektive til det.
re hjælper med at udfylde dette behov ved at få mennesker til at identificere objekter og tekster, som langsomt giver nok data til at opbygge robuste AI-programmer.
Hvad er en Turing-test? Hvordan er Turing-tests relevante for tests?
En Turing-test vurderer en computers evne til at efterligne menneskelig adfærd. Alan Turing, en tidlig pioner inden for computing, opfandt konceptet med en Turing-test i 1950. Et computerprogram “består” Turing-testen, hvis dens ydeevne under testen ikke kan skelnes fra et menneskes – hvis den opfører sig som et menneske ville handle. En Turing-test er ikke afhængig af at få svarene korrekte, det handler om, hvordan “menneske” svarene lyder, uanset om de er “rigtige eller forkerte.
Selvom det kaldes en” offentlig Turing-test “, er a virkelig det modsatte af en Turing-test – det afgør, om en angiveligt menneskelig bruger er faktisk et computerprogram (en bot) eller ej, i stedet for at prøve at afgøre, om en computer er menneskelig. For at opnå dette er der behov for at tildele en kort opgave, som folk har tendens til at være gode til, og computere kæmper med. Identifikation af tekst og billeder passer normalt til disse kriterier.