Оставайтесь
на связи

gpt party 2.0. Дэвид ян про цифровых сотрудников

В Кремниевой долине 7-8 октября прошло GPT Party 2.0 — самый масштабный русскоязычный нетворкинг-ивент, посвященный искусственному интеллекту. Более 300 человек собрались в Plug and Play, чтобы встретиться с ведущими экспертами, предпринимателями и инвесторами, обсудить последние тенденции в области искусственного интеллекта и получить практические знания.

На ивенте Дэвид Ян рассказал, кто такие цифровые сотрудники (digital workers) и на что они способны, поделился видением, как ИИ повлияет на нашу жизнь, а также показал примеры цифровых сотрудников, которые уже начинают заменять людей на рабочих местах.

часть 1: Кто такие цифровые сотрудники?

«Сейчас мы активно пользуемся ChatGPT, но до сих пор не очень понимаем, где проходят границы ее возможностей. Учеными были проведены специальные исследования, чтобы определить, на что уже сейчас способны современные LLM.

На графике ниже показаны проценты прохождения тестов LLM по ключевым параметрам. Синим обозначены результаты модели под названием GPT 3.5, а зеленым — те тесты, которые прошла система GPT 4.0, и ее результаты. Таким образом, мы сейчас достоверно можем констатировать, что GPT 4.0 проходит на высокую оценку 80% выпускных экзаменов американских колледжей.»

«Считается, что если профессиональные знания LLM еще может усвоить, то юмор компьютерам недоступен. В апреле этого года провели исследование способности GPT 4.0 к анализу юмора. Задание звучало так: объясни, что смешного изображено на фото. Система узнает предметы на фото и даже модели телефонов и описывает, что изображено на каждой из картинок. В конце она подводит итог, в чем состоит юмор этого изображения.»

«Ник Давыдов рассказывал о том, что большие лингвистические модели обучены предсказывать следующий токен, то есть следующие слова. Но удивительный факт, что когда этому «мозгу» дали прочитать практически все тексты, написанные человечеством за последние 2000 лет, он начал предсказывать не только слова, но последующий смысл. Система научилась рассуждать и с некоторыми оговорками мыслить. Это вызывает отдельную философскую дискуссию о том, что на самом деле в текстах, которые были написаны человечеством, уже заложены принципы мышления. Мы не будем сейчас подробно останавливаться, но это абсолютно удивительное явление.

Продолжим про исследования лингвистических моделей. В данном случае я анализирую статью от 13 апреля 2023 года на 150 страниц, в которой авторы пытаются понять границы возможностей модели. Мы уже все знаем, что большая лингвистическая модель умеет сочинять стихи, наблюдать изображения и манипулировать с ними. Они обладают достаточно серьезными способностями в области графического представления статистических исследований. Пример ниже демонстрирует тот факт, что LLM научились понимать физические объекты, их размеры, геометрию и отдельные свойства, а также законы гравитации. Задание было дано следующим образом: у нас есть книга, девять яиц, ноутбук, бутылка и гвоздь, расположи эти предметы друг на друге в наиболее устойчивом виде. И система рассказывает, что сначала нужно положить книгу на ровную поверхность, и она будет выступать основой. Затем система предлагает не просто расположить девять яиц в ряд три на три, но оставить между ними небольшое расстояние до конца, так как вес компьютера будет распределен между девятью яйцами, и таким образом они выдержат. Правда, он добавляет, что яйца должны быть не треснутыми. И в конце он предлагает расположить бутылку крышкой наверх, потому что сверху надо будет положить гвоздь на эту крышку. Ставить надо аккуратно, чтобы не развалилась.»

«Понимаете, в чем дело? Модель была обучена предсказывать следующие слова, но в данном случае она демонстрирует способности к рассуждению. Многие говорят, что лингвистические модели способны только на суммаризацию текста, но мы наблюдаем, что в данном случае происходит создание нового контента. Эта задача не была известна системе, так как ее придумали исследователи. Гарантировано известно, что такой задачи AI никогда раньше не встречал.

Ниже приводятся примеры способности модели к высшей математике и программированию, хотя считается, что математика — это не самая сильная часть модели модель. Большие лингвистические модели скорее гуманитарии, но представьте себе гуманитария, который решает интегральные уравнения второго порядка.»

«В 1980-е годы нейробиологи и когнитивные ученые придумали тест, чтобы определить, обладает ли индивидуум сознанием или нет, а если обладает, то сколько процентов сознание у нормального взрослого человека. Для этого был придуман тест под названием «Theory of Mind». Взрослый человек проходит тесты с результатом больше 90%. В 2020 году большие лингвистические модели проходили эти тесты меньше, чем на 10%, в 2021-м году они уже проходили на 30%, а в 2023 году ChatGPT 4 прошла эти тесты на 95%.

То есть формально мы должны признать, что в этой черной комнате находятся существа, обладающие сознанием. Или мы ничего не знаем про человеческое сознание? Вообще что такое сознание? Это отдельная большая тема. Последние четыре года мы создаем небиологического компаньона по имени Морфиус, в которого мы пытались внедрить сознание и подсознание. Мы создали три модели: одна модель разговаривала с внешним миром, а две другие модели разговаривали друг с другом. Они всегда обсуждали происходящее, как бы рефлексировали весь этот мир, но никогда не общались с внешним миром.

Я был на конференции, где мы пытались понять, что такое сознание, определиться с терминологией. Считается, что сознание — это некое состояние, в котором индивидуум проявляет как минимум эти 10 ментал стейтс: восприятие, внимание, мыслительный процесс, внимание, намерение, память, воображение, самосознание, убеждения, желания. Самое интересное, что значительное количество из этих ментал стейтс LLM демонстрируют.»

часть 2: как ИИ изменит нашу жизнь?

«Согласно Goldman Sachs 300 миллионов рабочих мест исчезнут или будут каким-то образом изменены благодаря появлению искусственного интеллекта. Различные исследования, в частности в университете Пенсильвании, считают, что 50% профессий будут изменены под влияем ИИ. Согласно Routers 27% профессий в сфере knowledge workers находится под угрозой ИИ-революции. Явление настолько масштабное, что мы решили создать Ассоциацию цифровых сотрудников. В ассоциации мы считаем, что все-таки эти 300 миллионов рабочих мест будут новыми, они не заберут работу у существующих биологических сотрудников.

Я согласен с той частью спикеров, которые считают, что ИИ-революция приведет к тому, что мы будем заниматься более творческой работой и тратить на это меньше времени, посвящая большую часть жизни семье, детям, хобби и так далее. Рабочая неделя в очередной раз сократится: буквально 200 лет назад не было выходных дней, потом появился один выходной в неделю, теперь выходных два, а скоро будет три или четыре выходных в неделю.»

часть 3: конкретные примеры работы цифровых сотрудников

«Отличие цифрового сотрудника от тулзы и копайлотов, которые помогают в работе, очень простое. Цифровые сотрудники — это предельная изолированная версия приложения, которая обладает форм-фактором человека. В отличие от копайлота, который используется в GitHub и помогает программисту писать код, цифровой сотрудник изолирован и существует сам по себе. У него есть имя, телефон, электронная почта, аккаунт Microsoft. Ему можно позвонить, написать, дать задание, позвать на митинг или на стендап с командой, и он будет вместе с остальными сотрудниками слушать указания от руководителя.

На одной из предыдущих панелей рассказывалось о том, как сложно и долго внедряются любые тулзы. Так происходит, потому что внедрение требует изменения бизнес-процессов. Но что касается цифровых сотрудников, то мы ничего не меняем в производственном процессе организации.

Диджитал сотрудники решают большую проблему руководителей организаций, которые сталкиваются с постоянной текучкой сотрудников на рабочих местах. Представим руководителя, у которого на первой линии технического поддержки сидит 100 человек и минимум 40 из них уволится в этом году. На их места нужно найти новых людей, провести собеседования, потратить время на онбодинг, и после этого через четыре месяца сотрудники снова увольняются.

Частные предприниамтели сталкиваются с другой проблемой. Представьте себе владельца спа-салона, который сам также оказывает услуги. Пока человек делает процедуру, никто не сидит на ресепшн и не отвечает на звонки. Таким образом он теряет до 40% входящих звонков, люди оказываются недовольны и уходят. Находить людей на ресепшн очень сложно, так как многие воспринимают эту работу как временную, поэтому они не вовлечены, не перезванивают клиентам и не знают полной информации о продукте.

Как могут помочь цифровые сотрудники в этом случае? Цифровой сотрудник — это интеллектуальный агент, который обладает всеми каналами коммуникации: звонок по телефону, имя, мессенджер и физическое присутствие. Робот, который выполняет коммуникационную работу, может узнать человека, который только что звонил, или приветливо встретить на ресепшн и все рассказать.

На схеме ниже изображен принцип работы таких систем. В нижней части находятся большие лингвистические модели. Средняя часть — это долгосрочная и среднесрочная память. Когда ставится задача ставится, система сама принимает решение на основе информации о текущем статусе. Она анализирует цель, которую надо добиться, и конкретные инструментах, которые у нее есть в распоряжение, и далее строит последовательность шагов, которые необходимо выполнить для этого. В правой части находятся все внешние статические и динамические данные компании. Статические данные — это редко меняющиеся данные о сервисах и компании, к ним относится сайт, PDF, инструкции, базы знании. К динамическим данным относится то, что может меняться каждую секунду: Jira, билеты, CRM, ERP и так далее. Слева находится тот самый человек, который позвонил или пришел к вам, и с ним ведется общение. Слева коммуникационный интерфейс, там расположены телефон, мессенджеджеры или физический робот. Это верхнеуровневая архитектура построение цифрового сотрудника поверх большой лингвистической модели.»

«Для внедрения существуют современной платформы, одной из которых занимаемся мы. Она называется neow.ai. Эта платформа позволяют выполнить пять шагов для внедрения сотрудника. Происходит digital transformation without transfarmation, то есть в данном случае мы не говорим об изменении бизнес процессов организации, так все внедрение схоже с адаптацией людей. Сначала нужно взять инструкции, которые используются для обучения биологического сотрудника. Далее подключить систему к вашим статическим и динамическим информационным каналам, это можете делать самостоятельно, так как это не требует глубоких технических навыков. На третьем шаге подключаются каналы, с которыми обычно работает сотрудник: электронная почта, Slack и так далее. Затем идет тестирование, точно так же как тестируются новые биологические сотрудники. Когда люди приходят работать на техническую поддержку, сначала они изучают пачку документов с продуктами компании, ценами, сервисами, типовыми кейсами и вопросами, а далее он проходит тест на готовность к рабочим задачам. Эти же тесты даются цифровым сотрудникам. Если он начинает работать нормально, то его работа почти неотличима от работы биологического сотрудника. То есть человек, который звонит в организацию, может никогда не узнать, что там сидит не биологический сотрудник, потому современные агенты говорят прекраснейшим языком. На создание первого рабочего варианта сотрудника может уйти два дня и еще неделя или чуть больше на его тестирование.

Сейчас мы адаптируем еще одного робота Мокси для физического применения. Это робот, который умеет поворачиваться, у него есть движение тела, жесты руками, но главное, что он эмоционален. Он может обижаться, удивляться, и когда человек ходит по комнате, он следит за ним и держит визуальный контакт.

Комбинация звонка, электронного письма и физического присутствия вместе создают совершенно другой клиентский опыт.»

Присоединяйтесь к следующему мероприятию SFIH,