Comment fonctionnent les CAPTCHA | Que signifie CAPTCHA?
Qu’est-ce qu’un?
Un test est conçu pour déterminer si un utilisateur en ligne est vraiment un humain et non un robot. est un acronyme qui signifie «Test de Turing public complètement automatisé pour distinguer les ordinateurs et les humains». Les utilisateurs rencontrent et refont souvent des tests sur Internet. Ces tests sont un moyen de gérer l’activité des bots, bien que l’approche ait ses inconvénients.
Bien que les s soient conçus pour bloquer les bots automatisés, les s sont eux-mêmes automatisés. Ils « sont programmés pour apparaître à certains endroits sur un site Web, et ils réussissent ou échouent automatiquement aux utilisateurs.
Comment ça marche?
Les classiques, qui sont toujours utilisés sur Certaines propriétés Web d’aujourd’hui impliquent de demander aux utilisateurs d’identifier des lettres. Les lettres sont déformées de sorte que les robots ne sont pas susceptibles de les identifier. Pour réussir le test, les utilisateurs doivent interpréter le texte déformé, saisir les lettres correctes dans un champ de formulaire , puis envoyez le formulaire. Si les lettres ne correspondent pas, les utilisateurs sont invités à réessayer. Ces tests sont courants dans les formulaires de connexion, les formulaires d’inscription de compte, les sondages en ligne et les pages de paiement du commerce électronique.
L’idée est qu’un programme informatique tel que un robot sera incapable d’interpréter les lettres déformées, tandis qu’un être humain, habitué à voir et à interpréter des lettres dans toutes sortes de contextes – différentes polices, différentes écritures, etc. – sera généralement capable de les identifier.
Le mieux que de nombreux robots pourront faire est de saisir des lettres aléatoires, ce qui rend statistiquement improbable qu’ils réussissent le test. Ainsi, les robots échouent au test et ne peuvent pas interagir avec le site Web ou l’application, tandis que les humains peuvent continuer à l’utiliser comme d’habitude.
Les robots avancés sont capables d’utiliser l’apprentissage automatique pour identifier ces lettres déformées, donc ces types de tests sont remplacés par des tests plus complexes. Google re a développé un certain nombre d’autres tests pour trier les utilisateurs humains des robots.
Qu’est-ce que re?
re est un service gratuit que Google propose en remplacement des s traditionnels. La technologie re a été développée par des chercheurs de l’Université Carnegie Mellon, puis acquise par Google en 2009.
re est plus avancée que les tests classiques. Par exemple, certaines résolutions obligent les utilisateurs à saisir des images de texte que les ordinateurs ont du mal à déchiffrer. Contrairement aux s classiques, récupère le texte à partir d’images du monde réel: images d’adresses, texte de livres imprimés, texte d’anciens journaux, etc.
Au fil du temps, Google a élargi la fonctionnalité des re-tests afin qu’ils n’aient plus à se fier à l’ancien style d’identification du texte flou ou déformé. Les autres types de re tests incluent:
- Reconnaissance d’image
- Case à cocher
- Évaluation générale du comportement de l’utilisateur (aucune interaction de l’utilisateur)
Comment fonctionne un nouveau test de reconnaissance d’image?
Pour un nouveau test de reconnaissance d’image, les utilisateurs reçoivent généralement des images de 9 ou 16 carrés. Les images peuvent toutes provenir de la même grande image ou être différentes. Un utilisateur doit identifier les images contenant certains objets, tels que des animaux, des arbres ou des panneaux de signalisation. Si leur réponse correspond aux réponses de la plupart des autres utilisateurs qui ont soumis le même test, la réponse est considérée comme « correcte » et l’utilisateur réussit le test.
Récupérer certains objets sur des photos floues est un problème difficile à résoudre pour les ordinateurs. Même les programmes avancés d’intelligence artificielle (IA) ont du mal avec elle – donc un robot aura également du mal avec elle. Cependant, un utilisateur humain devrait être capable de le faire assez facilement, car les humains sont habitués à percevoir des objets du quotidien dans toutes sortes de contextes et de situations.
Comment fonctionnent les tests avec une seule case?
Certains nouveaux tests invitent simplement l’utilisateur à cocher une case à côté de l’instruction « Je ne suis pas un robot. » Cependant, le test n’est pas l’action réelle de cliquer sur la case à cocher – c’est tout ce qui mène à cliquez sur la case à cocher.
Ce nouveau test prend en compte le mouvement du curseur de l’utilisateur à l’approche de la case. Même le mouvement le plus direct par un l’humain a une certaine quantité de hasard au niveau microscopique: de minuscules mouvements inconscients que les robots ne peuvent pas facilement imiter. Si le mouvement du curseur contient une partie de cette imprévisibilité, alors le test décide que l’utilisateur est probablement légitime. Il peut également évaluer les cookies stockés par le navigateur sur un appareil utilisateur et l’historique de l’appareil afin de dire si le l’utilisateur est probablement un robot.
Si le test ne parvient toujours pas à déterminer si l’utilisateur est un humain ou non, il peut présenter un défi supplémentaire, tel que le test de reconnaissance d’image décrit ci-dessus. Cependant, la plupart du temps, les mouvements du curseur, les cookies et l’historique de l’appareil de l’utilisateur sont suffisamment concluants.
Comment fonctionne re sans aucune interaction de l’utilisateur?
Les dernières versions de re sont capables de jeter un regard holistique sur le comportement d’un utilisateur et son historique d’interaction avec le contenu sur Internet. La plupart du temps, le programme peut décider en fonction de ces facteurs si ou non l’utilisateur n’est pas un robot, sans fournir à l’utilisateur un défi à relever. Sinon, l’utilisateur recevra un défi typique.
Qu’est-ce qui déclenche un test?
Certains Les propriétés Web sont automatiquement mises en place pour se défendre contre les bots. D’autres fois, un test peut être déclenché si le comportement de l’utilisateur semble ressembler au comportement d’un bot: si les utilisateurs demandent des pages Web ou cliquent sur des hyperliens à un taux beaucoup plus élevé que la moyenne, par exemple.
Les s et res sont-ils suffisants pour arrêter les bots malveillants?
Certains bots peuvent passer les textes par eux-mêmes. Les chercheurs ont démontré des moyens d’écrire un programme qui bat également la reconnaissance d’image. De plus, les attaquants peuvent utiliser des fermes de clics pour battre les tests: des milliers de travailleurs mal payés résolvant des s pour le compte de bots.
Outre a, il doit y avoir d’autres stratégies en place pour arrêter les bots indésirables (comme comme des robots de récupération de contenu, des robots de bourrage d’informations d’identification ou des robots de spam).
Quels sont les inconvénients de l’utilisation de s ou res pour arrêter les bots?
Mauvaise expérience utilisateur: un test peut interrompre le flux de ce que les utilisateurs essaient de faire, leur donnant une vue négative de leur expérience sur la propriété Web, et les conduisant à abandonner complètement la page Web dans certains cas.
Non utilisable pour les personnes malvoyantes: le problème avec s, c’est qu’ils reposent sur la perception visuelle. Cela les rend presque impossibles, non seulement pour les personnes légalement aveugles, mais pour toute personne gravement altérée par la vision.
Ces tests peuvent être trompés par les bots: comme décrit ci-dessus, les robots ne sont pas totalement à l’épreuve des robots et ne devrait pas être invoqué pour la gestion des bots.
Existe-t-il des alternatives à l’utilisation de s ou res?
Les solutions de gestion des bots comme Cloudflare Bot Management peuvent identifier les bots malveillants sans affecter l’expérience utilisateur , en fonction du comportement du bot. De cette façon, les bots peuvent être atténués sans forcer les utilisateurs à terminer les s.
Comment sont et quels sont les liens avec les projets d’intelligence artificielle (IA)?
Alors que des millions d’utilisateurs identifient du texte difficile à lire et choisissent des objets dans des images floues, ces données sont introduites dans des programmes informatiques d’IA afin qu’ils deviennent également meilleurs dans ces tâches.
En général, les programmes informatiques ont du mal à identifier des objets et des lettres dans différents contextes, car le contexte peut changer presque à l’infini dans le monde réel. Par exemple, un panneau d’arrêt est un octogone rouge avec des lettres blanches indiquant «STOP». Un programme informatique pourrait identifier assez facilement une combinaison forme-mot comme celle-là. Cependant, un panneau d’arrêt sur une photo peut être très différent de cette simple description en fonction du contexte: l’angle de la photo, l’éclairage, la météo en cause, etc.
Via l’apprentissage automatique, les programmes d’IA peut mieux surmonter ces limitations. Pour l’exemple de panneau d’arrêt, le programmeur fournirait au programme AI un tas de données sur ce qui est et n’est pas un panneau d’arrêt. Pour que cela soit efficace, ils ont besoin de nombreux exemples d’images avec des panneaux d’arrêt et des images sans panneaux d’arrêt, et ils ont besoin d’utilisateurs humains pour les identifier jusqu’à ce que le programme ait suffisamment de données pour être efficace.
re aide à combler ce besoin en amenant les humains à identifier les objets et les textes, ce qui fournit lentement suffisamment de données pour construire des programmes d’intelligence artificielle robustes.
Qu’est-ce qu’un test de Turing? En quoi les tests de Turing sont-ils pertinents pour les tests?
Un test de Turing évalue la capacité d’un ordinateur à imiter le comportement humain. Alan Turing, un des premiers pionniers de l’informatique, a inventé le concept d’un test de Turing en 1950. Un programme informatique « réussit » le test de Turing si ses performances pendant le test sont indiscernables de celles d’un humain – s’il agit comme un humain agirait. Un test de Turing ne dépend pas de l’obtention de réponses correctes; il s’agit de savoir comment « humain » les réponses sonnent, qu’elles soient «bonnes ou mauvaises».
Bien que cela s’appelle un «test de Turing public», a est en réalité le contraire d’un test de Turing – il détermine si un utilisateur supposé être humain est en fait un programme informatique (un bot) ou non, au lieu d’essayer de déterminer si un ordinateur est humain. Pour ce faire, il faut assigner une brève tâche pour laquelle les gens ont tendance à être bons et avec laquelle les ordinateurs ont du mal. L’identification du texte et des images répond généralement à ces critères.