CAPTCHA– человек ты или робот?

XXV Международный конкурс научно-исследовательских и творческих работ учащихся
Старт в науке

CAPTCHA– человек ты или робот?

Никель Д.Д. 1
1МБОУ Наро-Фоминская СОШ №5 СУИОП
Цвеловская Ю.В. 1
1МБОУ Наро-Фоминская СОШ №5 СУИОП
Автор работы награжден дипломом победителя II степени
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Введение

Актуальность:

В наше время стремительного технологического развития, вопрос кибербезопасности становится актуальнее. Одним из инструментов защиты сайтов и личной информации пользователей стала CAPTCHA (капча) - компьютерный тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером. Данный термин появился в 2000 году и используется по сей день. Держа ботов, которые являются виртуальными роботами, подальше от своих сайтов и используя капча, операторы – создатели используемого сайта – гарантируют, что их списки для рассылок точны, конкурсы проводятся честно, товары и билеты не продаются спекулянтам, а самое главное, наши данные не будут украдены. Так, например, по состоянию на 2013 год, каждый день пользователями по всей планете вводится примерно 320 миллионов капч. При этом в 2022 году 42% россиян столкнулись со взломом своих страниц в соцсетях. 30,5% единожды стали жертвами преступников, а 12,4% - многократно.

Цель исследования:

Исследовать строение и генерацию капчи, то как она влияет на искусственный интеллект, не устарела ли данная разработка, а так же положительное и отрицательное отношение человека к проверке.

Объект исследования

Капча и отношение человека к ней, возможные альтернативные решения, беспрепятственный обход капчи искусственным интеллектом.

Гипотеза:

  1. Рассмотрим научно-технологическую обоснованность существования капчи -­ сможет ли она остаться в будущем.

  2. Разберём её реальную пользу в защите интернет-источников.

  3. Выясним отношение людей к надоедливым и приевшимся проверкам на робота.

Задачи или этапы исследования:

  1. Изучение источников

  • История возникновения теста Тьюринга, основы капчи

  • Возникновение капчи

  • Механизм работы и разновидности капчи

  • Есть ли замена капче?

  1. Эффективность теста со временем развития технологий.

  2. Плюсы и минусы по мнению пользователей и общества (опрос).

  3. Разработка приложения

  4. Итоги исследования

Практическая значимость выполненной работы:

Как бы капча не раздражала пользователей, она всегда будет защитником от вредоносных программ и действий, мешающих нормальной работе сайтов. Данный проект даст нам знания о значимости капчи, так как мы живём в эпоху неспокойного интернета, где имеется вероятность стать обманутым и ограбленным.

Тест Тьюринга

Тест Тью́ринга — эмпирический тест, идея которого была предложена английским математиком с шотландскими корнями, криптограф, логик, чьим именем названа одна из самых престижных премий в области информатики Аланом Тьюрингом в статье «Вычислительные машины и разум», опубликованной в 1950 году в философском журнале Mind. Тьюринг задался целью определить, может ли машина мыслить.

В своей статье Тьюринг предложил вариант так называемой «Игры в имитацию». В нее играют трое: мужчина, женщина и исследователь, задающий вопросы, причем последний может быть любого пола. Каждый из них находится в отдельной комнате. Цель игры для исследователя — определить, кто мужчина, а кто женщина.

Тьюринг меняет концепцию этой игры, включив в нее искусственный интеллект (ИИ), человека-респондента и человека, задающего вопросы. Задача последнего — понять, кто является ИИ, а кто — человеком.

Идея о том, что машина может мыслить, казалась фантастической. Однако Тьюринг предвидел, что технологический прогресс приведет к созданию машин, способных выполнять сложные интеллектуальные задачи. Его работа заложила основу для будущих исследований и разработок в области искусственного интеллекта.

Сегодня, когда системы искусственного интеллекта становятся все более сложными и мощными, тест Тьюринга продолжает оставаться актуальным. Он служит важным ориентиром для разработчиков ИИ, помогая им оценивать прогресс своих систем. Кроме того, тест Тьюринга поднимает важные вопросы о том, как мы должны относиться к машинам, которые могут демонстрировать интеллектуальное поведение.

Тест Тьюринга лёг в основу работы современной капчи, но теперь проверкой в ней занимается не абстрактный человек, а алгоритм.

Возникновение капчи

В нулевых годах интернет активно развивался, и с ним появились первые спамеры, рассылающие электронные письма с мошенническими предложениями. Особенно запомнились рассылки от нигерийских принцев (некоторые подобные сообщения приходят людям и в настоящее время).

Одной из основных проблем было то, что почтовые сервисы не были защищены от таких атак. Боты создавали огромное количество спам-аккаунтов, что приводило к серьезным проблемам не только для пользователей, теряющих деньги, но и для всего интернета. Кроме того, такие рассылки создавали большую нагрузку на серверы. Аналогичная ситуация была с регистрацией спам-аккаунтов на форумах и других сайтах.

Было необходимо разработать защиту, которая усложнила бы автоматическую регистрацию подобных аккаунтов. Капча стала одним из таких решений. Программа CAPTCHA (капча) расшифровывается как «полностью автоматизированный публичный тест Тьюринга для различия компьютеров и людей».

История капчи начинается в 2000 году, когда команда Луиса Фон Ана из Университета Карнеги-Меллон разработала первый прототип для борьбы со спамом и фейковыми аккаунтами. В те годы проблема автоматизированных ботов, заполнявших интернет спамом, стояла остро. Решение оказалось гениально простым: людям легко распознавать искаженные символы, а вот для компьютеров эта задача была слишком сложной. Таким образом, капча стала первым инструментом, который мог отличить человека от машины. Ежедневно пользователи интернета помогали расшифровывать по 100 млн. слов. Развитие ботов также не остановилось, со временем они поумнели и научились распознавать текстовые коды капчи.

В 2009 году появилась улучшенная версия — reCAPTCHA. Помимо проверки пользователей, эта система стала использовать их усилия для оцифровки книг и документов. Пользователям показывались два слова: одно — известное системе, а второе — взято из сканированного текста, который не удалось распознать автоматически. Таким образом, вводя капчу, люди одновременно помогали в оцифровке тысяч книг. Эта технология стала важным шагом в сохранении культурного наследия в цифровом формате.

В 2014 году Google предложил новую, более удобную для пользователей систему — No CAPTCHA. Теперь вместо ввода искаженных символов достаточно просто поставить галочку «Я не робот». Однако, если система «сомневается», она предлагает пользователю дополнительные задачи — например, выбрать на изображениях светофоры, пешеходные переходы или витрины магазинов. Эти задания стали не только способом проверки на человечность, но и инструментом для обучения искусственного интеллекта, который используется, например, в разработке беспилотных автомобилей.

Виды капчи

Капча бывает нескольких видов:

  • Распознавание текста.

Традиционный тип капчи, алгоритм которой требует от пользователя ввести ряд цифр и букв. Чаще всего текстовая строка искажена различными цветовыми и шумовыми фильтрами, а символы в ней перечёркнуты или имеют наклон. Данный тип можно встретить в сервисах Яндекса и социальной сети «ВКонтакте»

  • Выбор изображений.

При таком виде капчи алгоритм просит пользователей идентифицировать набор фотографий (к примеру, указать все изображения с гидрантами). Обычно картинки защищены от распознавания ботами с помощью специального шума, который они не в состоянии отсеять.

  • Логическая задача. Алгоритм проверяет, может ли условный пользователь перед ней мыслить. Головоломки могут быть разными:

    • Система просит пользователя решить математический пример — как вариант, сложить или вычесть пару чисел;

    • Капча просит выбрать определённый объект — например, найти фотографию, на которой изображён человек с поднятой рукой;

    • Задача выбрать одну цифру из набора — как вариант, нужно написать вторую или третью цифру из числа 1741505;

    • Нужно выбрать слово, которое начинается с конкретной буквы.

  • Трёхмерная капча. Она требует, чтобы пользователь идентифицировал изображение, буквы или числа, которые отображаются в трёх измерениях. Это — усложнённый вариант любого из предыдущих типов.

  • Маркетинговая капча. Алгоритм такой капчи просит пользователя ввести слово или фразу, соответствующую определённому бренду.

  • Капча «Я не робот». Требует, чтобы пользователь установил флажок, чтобы доказать, что он не робот. Правдивость этого утверждения определяется секундами на выполнение и другими более сложными механизмами. Капча фиксирует время на вашем компьютере и часовой пояс. Она определяет приблизительное местонахождение и браузер, который используется. Она берёт в учёт даже разрешение экрана, на котором отображается. Отслеживаются также движение мыши и другие средства для контроля курсора, нажатия. Обычно также сканируются кукисы и анализируется история поисковых запросов.

В сё описанное выше нужно для определения, кто находится за компьютером. Если система всё ещё сомневается, то выводит текстовую или другую капчу, которая усилит уверенность определения робота.

  • Звуковая капча. Представляет пользователю серию произносимых букв или цифр. Часто пользователь может запросить текстовое отображение. Случается и обратный вариант — когда звук становится альтернативой тексту.

  • Капча драг-н-дроп. Она, к примеру, может предложить собрать изображение, перемещая его части.

  • Капча Honeypot. Она размещает на экране скрытые поля, которые невидимы для человека, но понятны для бота. Когда программное обеспечение начинает взаимодействовать с кодом, становится понятно, что сервис использует не человек, а машина. Такие действия нужно блокировать.

Замена капче

Искусственный интеллект и технологии машинного обучения способствуют тому, чтобы боты научились анализировать изображения и идентифицировать буквы, скрытые в них. Они даже могут аккуратно идентифицировать элементы в изображениях, позволяя обходить новейшие версии систем капчи.

К сожалению, это означает, что капча не может далее предлагать полную защиту от ботов. Это также означает, что дальнейшее использование капчи на веб-сайтах может подвергнуть их риску взлома.

Специалисты по веб-технологиям ищут другие способы определить, является ли пользователь человеком или компьютером. Одним из решений, предлагаемых компанией Amazon, является использование теста, который человек, наоборот, должен провалить: например, за определенное время указать, сколько раз буква «е» встречается в длинном предложении. Боты такие тесты всегда проходят, а вот человек в подавляющем большинстве случаев - нет.

Google разработал другой альтернативный вариант, который они называют «Invisible reCaptcha». Система использует искусственный интеллект для обнаружения того, как вы взаимодействуете веб-страницей, отслеживая, например, движения мышки и количество нажатий. А все потому, что бот не делает таких «человеческих» движений, в результате этого система может определить ботов и заблокировать их, при этом вы даже не будете знать о работе этой системы.

Эффективность теста

Доктор Эндрю Сирлиз и его коллеги – ученые из Калифорнии – авторы исследования под названием «Ошеломленный и растерянный: крупномасштабное исследование reCAPTCHAv2 на реальных пользователях» утверждают, что от всех видов этого сервиса следует поскорее отказаться, притом по целому списку причин. В 2014 г Google обнаружил, что в 99% случаев боты могут обойти защиту, предоставленную капчей. Помимо неспособности противостоять искусственному интеллекту все виды капчи не нравятся пользователям. К тому же эти тесты требуют больших затрат времени и ресурсов центра обработки данных.

Еще 4 года назад издание Wired – ежемесячный американский журнал – констатировало, что привычная капча умирает. А ведь это было задолго до бума нейросетей 2022—2023 годов. ИИ стали настолько хороши, что им даже не нужно самим доказывать, что они не роботы — можно использовать людей. В марте 2023 года GPT-4 притворилась незрячим человеком и попросила собеседника-человека помочь ей с решением капчи. Она оказалась достаточно убедительна и добилась своего. Таким образом компания OpenAI тестировала нейросеть на потенциально опасное поведение.

В актуальной GPT-4 такой функции, конечно, нет. Более того, нейросеть отказывается решать капчу, если скинуть ей картинку. Но пользователи соцсетей разными способами активируют скрытую функцию. Самый популярный вариант — наложить картинку с капчей на фото кулона и рассказать грустную историю, что украшение принадлежало умершей бабушке пользователя.

Я пришел к такому выводу: стандартная капча — уже не очень большая проблема для роботов. На сегодняшний день капча отстает, ИИ побеждает. Как следствие, капча усложняется и не все могут её решить с первого раза. Например, пожилым людям или пользователям со слабым зрением может понадобиться больше времени для решения головоломок. Так же и роботы на это отвечают и становятся умнее. Исследователи снова усложняют капчу. И эта гонка происходит постоянно. Кто страдает от этого больше всего? Мы – пользователи.

Капчу приходится проходить в интернете все чаще. Она появляется как следствие «подозрительного поведения», при этом компьютеры учатся лучше маскироваться под людей, а мы, в свою очередь, стараемся оставлять меньше цифрового следа с помощью VPN и других приемов. Иногда вместо нескольких секунд решение капчи может растянуться на минуты — целая вечность, учитывая цель просто зайти на нужный сайт.

Проблемы возникают даже с классической reCAPTCHA. Сколько шуток сделали про гидранты, светофоры и пешеходные переходы. Люди до сих пор не понимают: а вот кусочек светофора залез на другую картинку, ее отмечать? А если светофора нет, но есть столб?

Луис Фон Ан– аспирант в американском университете Карнеги-Меллон – подтверждает, что капча стала сложнее, чем 2000-ых годах. Но, по его словам, в среднем на решение теста с картинками из «Гугл-карт» у пользователей уходит девять секунд, с задачей справляются 92% пользователей. Система подбирает более сложные варианты только в случае, если слишком много ботов пытается попасть на сайт.

Но что делать со все новыми видами капчи? По мере улучшений в области искусственного интелекта их становится слишком много. На данный момент 97% сайтов использует капчу. Мало того, что они новые — из-за частой смены нарушается привычка решать одни и те же тесты. И каждый раз приходится задумываться, как пройти очередную проверку на робота. Кому-то из пользователей попадаются сложные математические примеры, которые за пару секунд не решить. Другие же оказываются один на один с «безумными лабиринтами, по которым нужно довести крысу в поисках сыра».

Итоги опроса

Я решил выяснить насколько хорошо люди ознакомлены с капчей и их отношение к ней с помощью опроса. Опрос был проведен с помощью Google Формы. Ссылка для прохождения: https://forms.gle/1kVm98w1BuLpfkGW7.

Вот вопросы и ответы людей на них:

Из ответов, я могу сделать вывод: люди знакомы с капчей, она может раздражать своей сложностью и навязчивостью, но при этом люди считают её полезной и относятся к ней положительно или нейтрально.

Заключение

Конечно, капча нравится далеко не всем, но на данный момент — это лучшая технология для борьбы с ботами, которые используют системы автоматизации для решения задач своих владельцев. Разработчики тестов стараются сделать их как можно более простыми для пользователей, но с ростом активности злоумышленников эта задача становится только сложнее. Поэтому есть предложение не относиться к капче слишком критично, ведь она даёт возможность пользоваться большими крутыми сервисами, которые без неё не были бы доступны.

П риложение

Мной было разработано тренировочное задание на соотношение видов «капчи» с тем, как они выглядят:

Ссылка: https://learningapps.org/40005048

О твет на задание находится в главе Виды капчи

Список литературы

  1. https://lpgenerator.ru/blog/chto-takoe-test-tyuringa/#chto-predstavlyaet-iz-sebya-test-tyuringa – Тест Тьюринга: что это такое и как его проходит искусственный интелект

  2. https://ru.wikipedia.org/wiki/Капча – Капча википедия

  3. https://dtf.ru/u/807468-murchim-pro-gpt/1854987-raskryvaem-tainy-kapchi-vnutrennii-mir-zashity-ot-botov - Раскрываем тайны капчи: внутренний мир защиты от ботов

  4. https://vc.ru/ai/1606960-postavte-galochku-ya-ne-robot-istoriya-sozdaniya-i-evolyuciya-captcha - Поставьте галочку «Я не робот»: История создания и эволюция CAPTCHA

  5. https://itproger.com/news/otkuda-vzyalas-captcha – Откуда взялась капча?

  6. https://trashbox.ru/link/types-of-captchaCaptcha — это зло или добро? Какие бывают виды и в чем недостатки

  7. https://www.cloudav.ru/mediacenter/security/captcha-future/ – Captcha умирает? Что нас будет защищать в будущем?

  8. https://www.cnews.ru/news/top/2024-07-24_dokazano_testy_captcha_bespolezny – Доказано: тесты CAPTCHA бесполезны. Они не защищают от ботов, зато отнимают у людей время, эквивалентное миллиардам долларов

  9. https://journal.tinkoff.ru/captcha-besit/ – Почему капча становится все сложнее — и как все-таки доказать, что ты не робот

  10. https://techjury.net/blog/how-many-websites-use-captcha/ – How Many Websites Use CAPTCHA?

  11. https://ru.wikipedia.org/wiki/Wired - Wired – Википедия

Просмотров работы: 33