Как сделать тест тьюринга

Добавил пользователь Владимир З.
Обновлено: 01.09.2024


СОДЕРЖАНИЕ

[H] Как много разных автоматов или движущихся машин может быть создано индустрией человека . Ибо мы можем легко понять, как устроена машина, так что она может произносить слова и даже давать некоторые ответы на действия телесного типа. , что вызывает изменение его органов; например, при прикосновении к определенной части он может спросить, что мы хотим ему сказать; если в другой части он может воскликнуть, что ему больно, и так далее. Но никогда не бывает, чтобы он строил свою речь по-разному, чтобы должным образом отвечать на все, что может быть сказано в его присутствии, как это может сделать даже самый низкий тип людей. [10]

Здесь Декарт отмечает, что автоматы способны реагировать на человеческие взаимодействия, но утверждает, что такие автоматы не могут должным образом реагировать на вещи, сказанные в их присутствии, так, как это может делать любой человек. Таким образом, Декарт предвосхищает тест Тьюринга, определяя недостаточность соответствующей лингвистической реакции как то, что отделяет человека от автомата. Декарт не учитывает возможность того, что будущие автоматы смогут преодолеть такую недостаточность, и поэтому не предлагает тест Тьюринга как таковой, даже если он заранее представляет его концептуальную основу и критерий.

Дени Дидро формулирует в своих философских трудах Pens?es критерий теста Тьюринга:

Это не значит, что он согласен с этим, но это уже было обычным аргументом материалистов в то время.

В соответствии с дуализмом, то разум является нефизической (или, по крайней мере, имеет не-физические свойства ) [12] , и, следовательно, не могут быть объяснены в чисто физических терминах. Согласно материализму, разум можно объяснить физически, что оставляет возможность искусственно созданных умов. [13]

Аргументы, подобные аргументам Сирла и других исследователей философии разума, вызвали более интенсивные дебаты о природе интеллекта, возможности создания интеллектуальных машин и ценности теста Тьюринга, которые продолжались в течение 1980-х и 1990-х годов. [39]

Премия Лебнера обеспечивает ежегодную платформу для практических тестов Тьюринга, первое соревнование проводится в ноябре 1991 года. [40] Ее подписывает Хью Лебнер . Кембриджский центр поведенческих исследований в Массачусетсе , США, организовал призы до конкурса 2003 года включительно. Как описал Лебнер, одна из причин, по которой был создан конкурс, состоит в том, чтобы улучшить состояние исследований ИИ, по крайней мере частично, потому что никто не предпринял шагов по внедрению теста Тьюринга, несмотря на 40 лет его обсуждения. [41]

Премия Лебнера проверяет разговорный интеллект; победителями обычно становятся программы чаттер-ботов или искусственные разговорные сущности (ACE) . Ранняя премия Лебнера предписывала ограниченные разговоры: каждая запись и скрытый человек разговаривали на одну тему, [45] таким образом, следователи были ограничены одной линией допроса для каждого взаимодействия сущностей. Правило ограниченного разговора было снято в связи с премией Лебнера 1995 года. В Премии Лебнера продолжительность взаимодействия между судьей и организацией была разной. В Loebner 2003 в Университете Суррея каждому следователю было предоставлено пять минут для взаимодействия с сущностью, машиной или скрытым человеком. В период с 2004 по 2007 годы время взаимодействия, разрешенное в рамках призов Лебнера, составляло более двадцати минут.

В оригинальной статье Тьюринга описана простая партийная игра с участием трех игроков. Игрок A - мужчина, игрок B - женщина, а игрок C (который играет роль дознавателя) - любого пола. В имитационной игре игрок C не может видеть ни игрока A, ни игрока B и может общаться с ними только посредством письменных заметок. Задавая вопросы игроку A и игроку B, игрок C пытается определить, кто из двоих - мужчина, а кто - женщина. Роль игрока А состоит в том, чтобы обманом заставить дознавателя принять неправильное решение, в то время как игрок Б пытается помочь дознавателю принять правильное решение. [7]

Затем Тьюринг спрашивает:

Оригинальный тест с имитацией игры, в котором игрок А заменяется компьютером. На компьютер теперь возложена роль человека, в то время как игрок B продолжает попытки помочь следователю. Рисунок адаптирован из Сайгина, 2000. [7]

Вторая версия появилась позже в статье Тьюринга 1950 года. Как и в оригинальном тесте с имитацией игры, роль игрока А выполняет компьютер. Однако роль игрока B исполняет мужчина, а не женщина.

Давайте сосредоточим наше внимание на одном конкретном цифровом компьютере C. Верно ли, что, изменив этот компьютер, чтобы он имел адекватное хранилище, соответствующим образом увеличив его скорость работы и снабдив его соответствующей программой, можно заставить C удовлетворительно играть роль из A в игре с имитацией, где роль B занимает мужчина? [24]

В этой версии и игрок A (компьютер), и игрок B пытаются обманом заставить дознавателя принять неверное решение.

Тем не менее другие авторы [53] интерпретировали Тьюринга как предложение о том, что имитационная игра сама по себе является тестом, не уточняя, как принимать во внимание утверждение Тьюринга о том, что тест, который он предложил с использованием партийной версии имитационной игры, основан на критерии сравнительного анализа. частота успеха в этой имитационной игре, а не способность добиться успеха в одном раунде игры.

Должен ли следователь знать о компьютере? [ редактировать ]

Тест Фейгенбаума предназначен для использования широкого спектра тем, доступных для теста Тьюринга. Это ограниченная форма игры вопрос-ответ Тьюринга, в которой машина сравнивается со способностями экспертов в определенных областях, таких как литература или химия . IBM «s Уотсон машина достигла успеха в человек против машины телевизионной викторины человеческого знания, Jeopardy! [62] [48] [имеет отношение к этому параграфу? - обсудить ]

Будучи выпускником Кембриджа с отличием по математике, можно было ожидать, что Тьюринг предложит тест на компьютерный интеллект, требующий экспертных знаний в какой-то высокотехнологичной области, и, таким образом, предвосхищая более свежий подход к этому предмету . Вместо этого, как уже отмечалось, тест, который он описал в своей основополагающей статье 1950 года, требует, чтобы компьютер был в состоянии успешно участвовать в обычной партийной игре, и для этого он должен действовать так же хорошо, как обычный человек, отвечая на серию вопросов, чтобы убедительно притвориться участницей конкурса.

Учитывая статус человеческого полового диморфизма как одного из самых древних предметов , в приведенном выше сценарии подразумевается, что вопросы, на которые необходимо ответить, не будут включать ни специальные фактические знания, ни методы обработки информации. Задача компьютера, скорее, будет заключаться в том, чтобы продемонстрировать сочувствие к роли женщины, а также продемонстрировать характерную эстетическую чувствительность - оба качества демонстрируются в этом фрагменте диалога, который вообразил Тьюринг:

Допрашивающий: Скажите, пожалуйста, Х, длину его или ее волос? Участник: Мои волосы покрыты черепицей, а самые длинные пряди имеют длину около девяти дюймов.

Когда Тьюринг вводит некоторые специальные знания в один из своих воображаемых диалогов, речь идет не о математике или электронике, а о поэзии:

Тест Тьюринга напрямую не проверяет, разумно ли ведет себя компьютер. Он проверяет только, ведет ли компьютер себя как человек. Поскольку человеческое поведение и разумное поведение - не одно и то же, тест может не дать точного измерения интеллекта двумя способами:

Тест Тьюринга касается строго того, как действует субъект - внешнего поведения машины. В этом отношении он использует бихевиористский или функционалистский подход к изучению психики. Пример ELIZA предполагает, что машина, проходящая тест, может имитировать человеческое поведение в разговоре, следуя простому (но обширному) списку механических правил, вообще не думая и не имея ума.

Тьюринг предвосхитил эту линию критики в своей оригинальной статье [68], написав:

Я не хочу создавать впечатление, будто считаю, что в сознании нет никакой тайны. Есть, например, парадокс, связанный с любой попыткой его локализовать. Но я не думаю, что эти загадки обязательно нужно разгадывать, прежде чем мы сможем ответить на вопрос, который нас интересует в этой статье. [69]

На практике в результатах теста легко может доминировать не интеллект компьютера, а отношение, навыки или наивность спрашивающего.

Во-вторых, создание реалистичных симуляций людей - сложная задача сама по себе, которую не нужно решать для достижения основных целей исследований ИИ. Правдоподобные человеческие персонажи могут быть интересны в произведении искусства, игре или сложном пользовательском интерфейсе , но они не являются частью науки о создании интеллектуальных машин, то есть машин, которые решают проблемы с помощью интеллекта.

Роберт Френч (1990) утверждает, что следователь может различать собеседников-людей и нечеловеческих существ, задавая вопросы, которые раскрывают низкоуровневые (т. Е. Бессознательные) процессы человеческого познания, как это изучается когнитивной наукой . Такие вопросы раскрывают точные детали человеческого воплощения мысли и могут разоблачить компьютер, если он не воспринимает мир так, как это делают люди. [78]

Многие другие версии теста Тьюринга, в том числе изложенные выше, были выдвинуты на протяжении многих лет.

CAPTCHA - это форма обратного теста Тьюринга. Перед тем, как ему будет разрешено выполнить какое-либо действие на веб-сайте, пользователю предлагают буквенно-цифровые символы в искаженном графическом изображении и просят ввести их. Это предназначено для предотвращения использования автоматизированных систем для злоупотребления сайтом. Обоснование состоит в том, что программного обеспечения, достаточно сложного для точного чтения и воспроизведения искаженного изображения, не существует (или недоступно для обычного пользователя), поэтому любая система, способная сделать это, скорее всего, будет человеком.

Программное обеспечение, которое могло бы реверсировать CAPTCHA с некоторой точностью, анализируя шаблоны в движке генерации, начало разрабатываться вскоре после создания CAPTCHA. [82] В 2013 году исследователи из Vicarious объявили, что они разработали систему для решения задач CAPTCHA от Google , Yahoo! и PayPal до 90% времени. [83] В 2014 году инженеры Google продемонстрировали систему, которая может преодолевать проблемы CAPTCHA с точностью 99,8%. [84] В 2015 году Шуман Гхосемаджумдер , бывший руководитель Google по мошенничеству с кликами , заявил, что существуют киберпреступники.сайты, которые за определенную плату преодолеют вызовы CAPTCHA и позволят использовать различные формы мошенничества. [85]

Организаторы премии Hutter Prize считают, что сжатие текста на естественном языке - сложная задача искусственного интеллекта, эквивалентная прохождению теста Тьюринга.

Тест сжатия данных имеет некоторые преимущества перед большинством версий и вариаций теста Тьюринга, в том числе:

Основными недостатками использования сжатия данных в качестве теста являются:

Родственный подход к премии Хаттера, появившийся намного раньше, в конце 1990-х, - это включение проблем сжатия в расширенный тест Тьюринга. [92] или тестами, полностью выведенными из сложности Колмогорова . [93] Другие связанные тесты в этой строке представлены Эрнандес-Оралло и Доу. [94]

Алгоритмический IQ, или сокращенно AIQ, - это попытка преобразовать теоретическую универсальную меру интеллекта Легга и Хаттера (основанную на индуктивном выводе Соломонова ) в работающую практическую проверку машинного интеллекта. [95]

Двумя основными преимуществами некоторых из этих тестов являются их применимость к нечеловеческому разуму и отсутствие требований к тестерам-людям.

Тест Тьюринга вдохновил на создание теста Эберта, предложенного в 2011 году кинокритиком Роджером Эбертом, который проверяет, обладает ли компьютерный синтезированный голос достаточными навыками с точки зрения интонаций, интонаций, тайминга и т. Д., Чтобы рассмешить людей. [96]

В ноябре 2005 года в Университете Суррея состоялась первая однодневная встреча разработчиков искусственных речевых сущностей [98], на которой присутствовали победители практических тестов Тьюринга на получение премии Лебнера: Робби Гарнер , Ричард Уоллес и Ролло Карпентер . Среди приглашенных докладчиков были Дэвид Хэмилл , Хью Лебнер (спонсор премии Лебнера ) и Хума Шах .

Параллельно с 2008 Loebner премии состоялась в Университете Рединга , [99] общество по изучению искусственного интеллекта и моделирования поведения (AISB) провели однодневный симпозиум , чтобы обсудить тест Тьюринга, организованный Джоном Barnden , Марк Бишоп , Хума Шах и Кевин Уорвик . [100] Среди выступавших были директор Королевского института баронесса Сьюзан Гринфилд , Селмер Брингсйорд , биограф Тьюринга Эндрю Ходжес и ученый-исследователь сознания Оуэн Холланд.. Согласия по поводу канонического теста Тьюринга достигнуто не было, хотя Брингсьорд выразил мнение, что значительный приз приведет к тому, что тест Тьюринга будет пройден раньше.

В течение 2012 года состоялся ряд крупных мероприятий, посвященных жизни Тьюринга и его научному влиянию. Группа Turing100 поддержала эти мероприятия, а также организовала специальное мероприятие по тестированию Тьюринга в Блетчли-парке 23 июня 2012 года, чтобы отпраздновать 100-летие со дня рождения Тьюринга.


С тех пор, как Тьюринг впервые представил свой тест, он оказался очень влиятельным и широко критиковался, и он стал важной концепцией в философия искусственного интеллекта. [7] [8] [9] . Некоторые из этих критических замечаний, например, Джона Сёрла Китайская комната, сами по себе противоречивы.

Содержание

История

Философский фон

Вопрос о том, могут ли машины мыслить, имеет давнюю историю, которая прочно укоренилась в различии между дуалист и материалист взгляды на ум. Рене Декарт прообразует аспекты теста Тьюринга в его 1637 г. Рассуждение о методе когда он пишет:

[H] Как много разных автоматов или движущихся машин может быть создано индустрией человека . Ибо мы можем легко понять, как устроена машина, так что она может произносить слова и даже давать некоторые ответы на действие телесного типа. , что вызывает изменение его органов; например, при прикосновении к определенной части он может спросить, что мы хотим ему сказать; если в другой части он может воскликнуть, что ему больно, и так далее. Но никогда не бывает, чтобы он строил свою речь по-разному, чтобы должным образом отвечать на все, что может быть сказано в его присутствии, как это может сделать даже самый низкий тип людей. [10]

Здесь Декарт отмечает, что автоматы способны реагировать на человеческие взаимодействия, но утверждает, что такие автоматы не могут должным образом реагировать на вещи, сказанные в их присутствии, так, как это может делать любой человек. Таким образом, Декарт предвосхищает тест Тьюринга, определяя недостаточность соответствующей лингвистической реакции как то, что отделяет человека от автомата. Декарт не учитывает возможность того, что будущие автоматы смогут преодолеть такую недостаточность, и поэтому не предлагает тест Тьюринга как таковой, даже если он заранее представляет его концептуальную основу и критерий.

Дени Дидро формулирует в своем Философские мысли критерий теста Тьюринга:

Это не значит, что он согласен с этим, но это уже было обычным аргументом материалистов в то время.

Согласно дуализму, разум является нефизический (или, по крайней мере, нефизические свойства) [12] и, следовательно, не может быть объяснен в чисто физических терминах. Согласно материализму, разум можно объяснить физически, что оставляет возможность искусственно созданных умов. [13]

Алан Тьюринг

В статье Тьюринга было рассмотрено девять предполагаемых возражений, включающих все основные аргументы против искусственный интеллект которые возникли за годы, прошедшие с момента публикации статьи (см. "Вычислительная техника и интеллект"). [6]

Элиза и Пэрри

Китайская комната

Аргументы, подобные аргументам Сирла и других, работающих над философия разума вызвали более интенсивные дебаты о природе интеллекта, возможности создания интеллектуальных машин и ценности теста Тьюринга, которые продолжались в течение 1980-х и 1990-х годов. [39]

Премия Лебнера

Премия Лебнера обеспечивает ежегодную платформу для практических тестов Тьюринга, первое соревнование состоялось в ноябре 1991 года. [40] Он подписан Хью Лёбнер. Кембриджский центр поведенческих исследований в Массачусетс, США, организовала призы до конкурса 2003 года включительно. Как описал Лебнер, одна из причин, по которой был создан конкурс, состоит в том, чтобы улучшить состояние исследований ИИ, по крайней мере частично, потому что никто не предпринял шагов по внедрению теста Тьюринга, несмотря на 40 лет его обсуждения. [41]

Премия Лебнера проверяет разговорный интеллект; победители обычно болтун программ или Искусственные разговорные сущности (ACE) s. Ранняя премия Лебнера регулирует ограниченные разговоры: каждая запись и скрытый человек разговаривают на одну тему, [45] таким образом, следователи были ограничены одной линией допроса для каждого взаимодействия с сущностью. Правило ограниченного разговора было снято в связи с премией Лебнера 1995 года. Продолжительность взаимодействия между судьей и организацией варьировалась в Премии Лебнера. В Loebner 2003 из Университета Суррея каждому следователю было разрешено пять минут на взаимодействие с сущностью, машиной или скрытым человеком. В период с 2004 по 2007 годы время взаимодействия, разрешенное в рамках призов Лебнера, составляло более двадцати минут.

Версии

Имитационная игра

В оригинальной статье Тьюринга описана простая партийная игра с участием трех игроков. Игрок A - мужчина, игрок B - женщина, а игрок C (который играет роль дознавателя) - любого пола. В имитации игры игрок C не может видеть ни игрока A, ни игрока B и может общаться с ними только посредством письменных заметок. Задавая вопросы игроку A и игроку B, игрок C пытается определить, кто из двоих - мужчина, а кто - женщина. Роль игрока А состоит в том, чтобы обманом заставить следователя принять неправильное решение, в то время как игрок Б пытается помочь следователю принять правильное решение. [7]

Затем Тьюринг спрашивает:

Оригинальный тест с имитацией игры, в котором игрок А заменяется компьютером. На компьютер теперь возложена роль человека, в то время как игрок B продолжает попытки помочь следователю. Рисунок адаптирован из Сайгина, 2000. [7]

Вторая версия появилась позже в статье Тьюринга 1950 года. Как и в оригинальном тесте с имитацией игры, роль игрока А выполняет компьютер. Однако роль игрока B исполняет мужчина, а не женщина.

Обратим внимание на один конкретный цифровой компьютер. С. Верно ли, что, модифицируя этот компьютер, чтобы он имел адекватное хранилище, соответствующим образом увеличив его скорость работы и снабдив его соответствующей программой, C можно ли заставить удовлетворительно сыграть роль А в имитационной игре, когда роль В играет мужчина? [24]

В этой версии и игрок A (компьютер), и игрок B пытаются обманом заставить дознавателя принять неверное решение.

Стандартная интерпретация

Имитационная игра против стандартного теста Тьюринга

Еще другие писатели [53] интерпретировали Тьюринга как предложение о том, что имитационная игра сама по себе является тестом, без указания, как принять во внимание утверждение Тьюринга о том, что тест, который он предложил с использованием партийной версии имитационной игры, основан на критерии сравнительной частоты успеха в этой имитации. игра, а не способность преуспеть в одном раунде игры.

Должен ли следователь знать о компьютере?

Важнейшей частью любого лабораторного теста является наличие контроля. Тьюринг никогда не проясняет, знает ли следователь в его тестах, что одним из участников является компьютер. Однако, если бы существовала машина, способная пройти тест Тьюринга, можно было бы с уверенностью предположить, что потребуется двойной слепой контроль.

Сильные стороны

Управляемость и простота

Широта предмета

В Тест Фейгенбаума предназначен для использования преимуществ широкого круга тем, доступных для теста Тьюринга. Это ограниченная форма игры вопрос-ответ Тьюринга, в которой машина сравнивается со способностями экспертов в определенных областях, таких как литература или химия. IBMс Watson машина добилась успеха в телевизионной викторине о человеческих знаниях человек против машины, Опасность! [62] [ относится к этому абзацу? – обсуждать ]

Упор на эмоциональный и эстетический интеллект

Будучи выпускником Кембриджа с отличием по математике, можно было ожидать, что Тьюринг предложит тест на компьютерный интеллект, требующий экспертных знаний в какой-то высокотехнологичной области, и, таким образом, предвосхищая более свежий подход к предмету. Вместо этого, как уже отмечалось, тест, который он описал в своей основополагающей статье 1950 года, требует, чтобы компьютер был в состоянии успешно участвовать в обычной партийной игре, и для этого он должен действовать так же хорошо, как обычный мужчина, отвечая на серию вопросов, чтобы убедительно притвориться участницей конкурса.

Учитывая статус полового диморфизма человека как один из самых древних предметов, таким образом, в приведенном выше сценарии подразумевается, что вопросы, на которые необходимо ответить, не будут включать ни специальные фактические знания, ни методы обработки информации. Задача компьютера, скорее, будет заключаться в том, чтобы продемонстрировать сочувствие к роли женщины, а также продемонстрировать характерную эстетическую чувствительность - оба качества демонстрируются в этом фрагменте диалога, который вообразил Тьюринг:

Допрашивающий: Скажите, пожалуйста, Х, длину его или ее волос? Участник: Мои волосы покрыты черепицей, а самые длинные пряди имеют длину около девяти дюймов.

Когда Тьюринг вводит некоторые специальные знания в один из своих воображаемых диалогов, речь идет не о математике или электронике, а о поэзии:

Недостатки

Человеческий интеллект против интеллекта в целом

Тест Тьюринга напрямую не проверяет, разумно ли ведет себя компьютер. Он проверяет только, ведет ли компьютер себя как человек. Поскольку человеческое поведение и разумное поведение - не одно и то же, тест может не дать точного измерения интеллекта двумя способами:

Сознание против симуляции сознания

Тест Тьюринга касается строго того, как испытуемый действует - внешнее поведение машины. В связи с этим требуется бихевиорист или же функционалист подход к изучению разума. Пример ELIZA предполагает, что машина, прошедшая тест, может смоделировать поведение человека в разговоре, следуя простому (но обширному) списку механических правил, вообще не думая и не имея ума.

Тьюринг предвосхитил эту линию критики в своей оригинальной статье: [68] письмо:

Я не хочу создавать впечатление, будто считаю, что в сознании нет никакой тайны. Например, есть некоторый парадокс, связанный с любой попыткой его локализации. Но я не думаю, что эти загадки обязательно нужно разгадывать, прежде чем мы сможем ответить на вопрос, который нас интересует в этой статье. [69]

Наивность следователей и антропоморфная ошибка

На практике в результатах теста легко может доминировать не интеллект компьютера, а отношение, навыки или наивность задающего вопросы.

Программы чаттерботов, такие как ELIZA, неоднократно обманывали ничего не подозревающих людей, заставляя их поверить в то, что они общаются с людьми. В этих случаях "дознаватели" даже не подозревают о возможности взаимодействия с компьютерами. Чтобы успешно выглядеть человеком, машине совсем не обязательно иметь какой-либо разум, требуется лишь внешнее сходство с человеческим поведением.

Неправильная идентификация человека

Тишина

Непрактичность и нерелевантность: тест Тьюринга и исследования ИИ

Во-первых, есть более простые способы протестировать свои программы. Большинство текущих исследований в областях, связанных с ИИ, нацелены на скромные и конкретные цели, такие как автоматическое планирование, распознавание объекта, или логистика. Чтобы проверить интеллект программ, которые решают эти проблемы, исследователи ИИ просто дают им задачу напрямую. Рассел и Норвиг предлагают аналогию с история полета: Самолеты проверяются тем, насколько хорошо они летают, а не сравнением их с птицами. "Авиационная техника тексты, - пишут они, - не определяют цель своей области как «создание машин, которые летают так точно, как голуби что они могут обмануть других голубей. ' " [75]

Во-вторых, создание реалистичных симуляций людей - сложная задача сама по себе, которую не нужно решать для достижения основных целей исследований ИИ. Правдоподобные человеческие персонажи могут быть интересны в произведении искусства, игра, или сложный пользовательский интерфейс, но они не являются частью науки о создании интеллектуальных машин, то есть машин, которые решают проблемы с помощью интеллекта.

Наука о мышлении

Роберт Френч (1990) утверждает, что дознаватель может различать собеседников-людей и нечеловеков, задавая вопросы, раскрывающие низкоуровневые (т. Е. Бессознательные) процессы человеческого познания, как это изучалось наука о мышлении. Такие вопросы раскрывают точные детали человеческого воплощения мысли и могут разоблачить компьютер, если он не воспринимает мир как люди. [78]

Вариации

Многие другие версии теста Тьюринга, включая изложенные выше, были выдвинуты на протяжении многих лет.

Обратный тест Тьюринга и CAPTCHA

CAPTCHA является формой обратного теста Тьюринга. Прежде чем ему разрешат выполнить какое-либо действие на веб-сайте, пользователю предлагают буквенно-цифровые символы на искаженном графическом изображении и просят ввести их. Это сделано для предотвращения использования автоматизированных систем для злоупотребления сайтом. Обоснование этого состоит в том, что программного обеспечения, достаточно сложного для точного чтения и воспроизведения искаженного изображения, не существует (или недоступно для обычного пользователя), поэтому любая система, способная сделать это, скорее всего, будет человеком.

Программное обеспечение, которое могло бы с некоторой точностью реверсировать CAPTCHA, анализируя шаблоны в движке генерации, начало разрабатываться вскоре после создания CAPTCHA. [81] В 2013 году исследователи из Заместитель объявили, что они разработали систему для решения задач CAPTCHA из Google, Yahoo!, и PayPal до 90% времени. [82] В 2014 году инженеры Google продемонстрировали систему, которая может преодолевать проблемы CAPTCHA с точностью 99,8%. [83] В 2015 г. Шуман Гхосемаджумдер, бывший царь Google по мошенничеству с кликами, заявил, что киберпреступник сайты, которые за определенную плату преодолеют вызовы CAPTCHA и позволят использовать различные формы мошенничества. [84]

Тест Тьюринга эксперта в предметной области

Общий тест Тьюринга

Электронные медицинские карты

Минимальный интеллектуальный тест сигнала

Приз Хаттера

Организаторы Приз Хаттера считают, что сжатие текста на естественном языке - сложная задача ИИ, эквивалентная прохождению теста Тьюринга.

Тест сжатия данных имеет некоторые преимущества по сравнению с большинством версий и вариаций теста Тьюринга, в том числе:

Основными недостатками использования сжатия данных в качестве теста являются:

Другие тесты, основанные на сжатии или колмогоровской сложности

Родственный подход к премии Хаттера, который появился намного раньше, в конце 1990-х, - это включение проблем сжатия в расширенный тест Тьюринга. [91] или тестами, которые полностью основаны на Колмогоровская сложность. [92] Другие связанные тесты в этой строке представлены Эрнандес-Оралло и Доу. [93]

Алгоритмический IQ, или сокращенно AIQ, представляет собой попытку преобразовать теоретическую универсальную меру интеллекта Легга и Хаттера (основанную на Индуктивный вывод Соломонова) в рабочий практический тест машинного интеллекта. [94]

Двумя основными преимуществами некоторых из этих тестов являются их применимость к нечеловеческому разуму и отсутствие требований к тестерам-людям.

Тест Эберта

Тест Тьюринга вдохновил Тест Эберта предложено в 2011 году кинокритиком Роджер Эберт это проверка того, синтезированный голос обладает достаточными навыками в плане интонаций, интонаций, тайминга и так далее, чтобы рассмешить людей. [95]

Прогнозы

Экстраполируя экспоненциальный рост технологий за несколько десятилетий, футурист Рэй Курцвейл предсказал, что компьютеры с возможностью тестирования Тьюринга будут произведены в ближайшем будущем. В 1990 году он установил год около 2020 года. [99] К 2005 году он пересмотрел свою оценку до 2029 года. [100]

В Проект длинной ставки Ставка № 1 ставка $20,000 между Митч Капор (пессимист) и Рэй Курцвейл (оптимист) относительно того, выдержит ли компьютер длительный тест Тьюринга к 2029 году. Во время теста Long Now Turing Test каждый из трех судей теста Тьюринга проведет онлайн-собеседование с каждым из четырех кандидатов теста Тьюринга (т. е. компьютера и три человеческих фольги для теста Тьюринга) по два часа каждая, в общей сложности восемь часов интервью. Ставка подробно описывает условия. [101]

Конференции

Коллоквиум Тьюринга

Коллоквиум 2005 года по разговорным системам

В ноябре 2005 г. Университет Суррея провела первое однодневное собрание разработчиков искусственных диалоговых сущностей, [103] присутствовали победители практических тестов Тьюринга в Премии Лебнера: Робби Гарнер, Ричард Уоллес и Ролло Карпентер. Включены приглашенные спикеры Дэвид Хэмилл, Хью Лёбнер (спонсор Премия Лебнера) и Хума Шах.

Симпозиум AISB 2008 г.

Параллельно с 2008 г. Премия Лебнера проводился в Университет Ридинга, [104] то Общество изучения искусственного интеллекта и моделирования поведения (AISB), провел однодневный симпозиум по обсуждению теста Тьюринга, организованный Джон Барнден, Марк Бишоп, Хума Шах и Кевин Уорвик. [105] Среди спикеров был директор Королевского института. Баронесса Сьюзан Гринфилд, Сельмер Брингсйорд, Биограф Тьюринга Эндрю Ходжес, и ученый-сознание Оуэн Холланд. Согласия по поводу канонического теста Тьюринга достигнуто не было, хотя Брингсьорд выразил мнение, что значительный приз приведет к более раннему прохождению теста Тьюринга.

Год Алана Тьюринга и Turing100 в 2012 году

В течение 2012 года состоялся ряд крупных мероприятий, посвященных жизни Тьюринга и его научному влиянию. В Тьюринг100 группа поддержала эти мероприятия, а также организовала специальный тест Тьюринга в Bletchley Park 23 июня 2012 года по случаю 100-летия со дня рождения Тьюринга.

Искусственный интеллект и тест Тьюринга

Начнём же мы с краткого обзора темы искусственного интеллекта.

Искусственный интеллект

В качестве научного направления искусственный интеллект начал формироваться примерно в середине прошлого столетия, когда сформировалось достаточное количество предпосылок для этого. Например, философы всё больше спорили на тему природы человека и процессов познания мира, психологи и нейрофизиологи занимались разработкой теорий, касающихся мышления и работы человеческого мозга, математики и экономисты проводили всевозможные расчёты и представления знаний о мире и т.д. Таким образом и был заложен фундамент теории алгоритмов, благодаря чему появились первые компьютеры.

Практика показала, что потенциал машин в плане произведения вычислений намного больше человеческого, по причине чего в кругах учёных возник вопрос: а каков вообще потенциал компьютеров, и смогут ли машины со временем достичь уровня человеческого развития?

Подходы к созданию искусственного интеллекта

В первую очередь следует выделить общий подход к созданию искусственного интеллекта, который предполагает, что он будет способен к проявлению поведения, которое не будет отличаться от человеческого. Кстати, представленную идею можно назвать обобщением подхода теста Тьюринга, согласно которому машину можно считать разумной тогда, когда она будет в состоянии вести беседу с обычным человеком, и он не сможет отличить её от другого человека, при условии, что беседа идёт в письменной форме.

Третий поход называется символьным. По сути, именно он был изначально свойственен эпохе цифровых машин. После того как был создан первый язык символьных вычислений, разработчики стали уверены, что есть шанс и практической реализации искусственного интеллекта с помощью технологии символьных вычислений, благодаря чему стало бы возможным иметь дело со слабоформализованными смыслами и представлениями.

Был и логический подход к созданию искусственного интеллекта, основанный на моделировании рассуждений, и главным козырем которого являлась логика. Но с 90-х годов прошлого века начал развиваться агентно-ориентированный подход, основанный на применении интеллектуальных агентов и предполагающий, что интеллект является конкретно вычислительной составляющей потенциала машины достигать поставленные перед ней цели.

А в итоге появился гибридный подход, главная идея которого заключается в том, что только комплексное использование символьных и нейронных моделей поможет достичь полноценного спектра вычислительных и когнитивных возможностей. К примеру, нейронные сети могут генерировать экспертные правила рассуждений, а посредством статистического обучения можно сформировать порождающие правила.

Теперь же вернёмся к тесту Алана Тьюринга.

Тест Тьюринга

Тест Тьюринга, как мы и упомянули, предназначен для определения потенциала искусственного интеллекта, близкого к интеллекту человека. Классическую интерпретацию данного теста можно выразить так: человек взаимодействует с одним компьютером или человеком. Основываясь на ответах на определённые вопросы, человек должен определить, кто является его собеседником: компьютер или человек. А в функции компьютерной программы входит введение человека в заблуждение и подведение его к неправильному выводу. В процессе теста никто из участников не видит друг друга.

Данный факт, несомненно, является огромнейшим шагом в исследованиях по созданию искусственного интеллекта, однако учёные заявляют, что это достижение может быть использовано киберпреступниками.

Мы же в данном случае не можем не согласиться со специалистами, ведь сам факт того, что машина смогла убедить людей в том, что она человек, может перевернуть всю мировую компьютерную систему. Представьте только, какие вообще могут быть последствия, если кибернетические собеседники, обладающие искусственным интеллектом, смогут вести живую переписку с людьми, а спам-ботов станет невозможно распознать?

Заключение

Что же можно сказать об идее искусственного интеллекта? С одной стороны, она поистине потрясающа, и если искусственный интеллект будет создан, это позволит всему человечеству сделать огромный шаг вперёд в своём развитии. Но если посмотреть на это с критической точки зрения, сознающий искусственный разум, если он попадёт в руки недобросовестных людей, сможет нанести человеку не поддающийся никакому описанию вред. Философствовать на эту тему можно очень и очень долго, но мы не станем этим заниматься – пусть это станет пищей для вашего ума.

Мы же хотим лишь посоветовать вам заниматься развитием своего собственного интеллекта, и становиться умнее и образованнее, ведь за вас этого не сделает ни одна машина.

Что такое тест Тьюринга и почему его так сложно пройти?

Арсений Горохов изобрел первый персональный компьютер.

Тест проходил в Лондонском королевском обществе, его проведение организовал Университет Рединга, Великобритания. Авторами программы являются российский инженер Владимир Веселов, проживающий в настоящее время в США, и украинец Евгений Демченко, который живёт сейчас в России.

Что такое тест Тьюринга?

Стандартная интерпретация теста Тьюринга

Идея проверки предполагала общение человека с другим человеком и с компьютерной программой в течение пяти минут, только в текстовом режиме. Если компьютер сможет обмануть как минимум 30 % собеседников, тест считается пройденным. Эксперты общаются одновременно с живым человеком и роботом, находясь в разных комнатах и не видя друг друга. По окончании теста каждый из них должен сказать, кто из двух его собеседников был человеком, а кто — программой.

В субботу 7 июня 2014 года суперкомпьютер по имени Eugene попытался воссоздать интеллект тринадцатилетнего подростка — Евгения Густмана.

В тестировании, организованном Школой системной инженерии при Университете Рединга (Великобритания), участвовали пять суперкомпьютеров. Испытание представляло собой серию пятиминутных письменных диалогов.

Диаграмма: поведение человека и разумное поведение

Читайте также: