Будущее опять наступило внезапно и без предупреждения: в нашу жизнь ворвалось нечто принципиально новое: AI-агенты. Они абсолютно точно изменят нашу жизнь в самое ближайшее время, но, как и у любой передовой технологии, у нее есть не только плюсы, но и целая куча довольно жирных минусов.
Я попробовал поселить на свой ноутбук такого агента, и это оказалось чертовски интересным экспериментом, о котором я хочу вам рассказать в своём новом видео, чтобы вы смогли решить для себя, хотите ли вы стать героем научной фантастики прямо сейчас или пока не готовы к такому безрассудному поступку.
Мы не будем погружаться в скучные технические детали, а поговорим о сути – о том, что эта штука на самом деле собой представляет, какое место может занять в нашей жизни, какие риски с собой несёт и, разумеется, какие противоречивые чувства и эмоции вызывает.
AI-агенты – это просто
AI-агенты – это не просто какая-то новая технология, а, как я уже сказал, самая настоящая научная фантастика, ставшая реальностью. Та самая фантастика, которой мы зачитывались в детстве, та самая, которую показывали в голливудских блокбастерах, та самая, что удивляет, потрясает и вдохновляет.
Чат-боты, к которым мы уже успели привыкнуть – все эти GPT, Gemini, Grok’и и Deepseek’и, безусловно, хороши, но мне всегда в них чего-то не хватало. И только попробовав OpenClaw, я понял, чего именно.
Идея AI-агента проста до безобразия и именно этим восхитительно гениальна. Агент – это довольно простая программа, которая в базе может делать всего несколько примитивных вещей: получать текстовые сообщения от пользователя, передавать их чат-боту, получать от чат-бота инструкции и выполнять их на компьютере: запускать программы, выполнять команды, работать с файлами. И это изменило всё.
Благодаря этому ИИ стал способен не просто напрямую выполнять на вашем компьютере прикладные задачи – навести порядок в документах, посмотреть расписание встреч, разобрать почту – но и стал гораздо больше похож на живое существо.
У ИИ появилась долгосрочная память – теперь он может сохранять важные вещи в заметках на компьютере – а с памятью появилась и индивидуальность: имя, тон общения, история ваших с ним взаимоотношений, долгосрочные планы и многое другое. Это с горем пополам можно было реализовать и в чат-ботах, сохраняя выжимку из контекста и перенося её из чата в чат, когда контекстное окно переполняется, но в этом не было магии.
Магия появилась, когда чат-бот смог сохранять и изменять себя сам, без участия человека. Причём в части изменений его возможности практически не ограничены: агент может буквально переписать свой код с нуля или, например, добавить себе новые функции, которых раньше у него не было в принципе – практически как живой, развивающийся организм.
В общем, это новая страница в истории взаимоотношений человека с машинами и гигантский шаг вперёд. Всё это, безусловно, чертовски вдохновляет, но мы живём в реальном мире, и в нём любые чудеса имеют свою оборотную сторону. Но обо всём по порядку.
Установка: магия начинается
Устанавливается агент очень просто и даже сам подключается по интернету к бесплатной нейросети. И вот тут начинается забавное. С ним можно общаться сразу несколькими способами: через Терминал (если вам меньше 40 лет и вы не программист, то не факт, что вы вообще его видели), через веб-интерфейс, и через мессенджеры, когда вы их настроите. Я, как вы догадываетесь, предпочёл на старте олдскульный терминал.
Но, чтобы вы понимали, лимитов бесплатной нейросети хватает лишь на несколько промптов в сутки, которые годны лишь для того, чтобы помочь вам подключиться либо к платному чат-боту, либо к нейросети, установленной локально. И да, без нормальной, платной нейросети вся эта затея не имеет ни малейшего смысла. Это примерно как пытаться слушать симфонию по 10 нот в час – мучительно и глупо, так что сразу приготовьтесь раскошелиться.
Впрочем, для начала, чтобы попробовать, вам понадобится всего 10-20 долларов на подписку в одной из популярных нейросетей. Я решил слегка поэкспериментировать и вместо подписки заплатил по 15 долларов DeepSeek и Qwen, чтобы попробовать разное. Забегая вперёд, могу сказать, что Qwen мне понравился больше, и сейчас я хочу попробовать ещё одну нейросеть – MiniMax.
Всё это – китайские нейросети, и я выбрал их по двум причинам: во-первых, для работы с ними не нужен VPN, который стараниями Роскомнадзора работает всё хуже и хуже, и во-вторых, они самые дешёвые, а все агенты жрут токены, как не в себя.
Итак, я зарегистрировался, оплатил DeepSeek и Qwen через посредников, и началось именно то, ради чего всё это затевалось – чудеса! Просто пишешь в терминале «подключись к DeepSeek, вот ключ, вот ссылка», и агент начинает размышлять, ищет информацию о том, что именно нужно прописать в файлах конфигурации, и через несколько минут сообщает мне две новости: что ссылка, которую я ему дал, неверная, но он нашёл правильную и всё подключил.
Это чертовски приятно – просто формулировать задачи и наблюдать за тем, как агент ищет способы их решения, что-то устанавливает, настраивает и программирует. В фильме моего детства – «Приключения Электроника» – была такая песенка: «Позабыты хлопоты, остановлен бег, вкалывают роботы, а не человек». Лучше и не скажешь.
Однако, если бы всё было совсем хорошо, то мы бы уже полгода – примерно столько времени прошло с момента релиза OpenClaw – стремительно влетали бы в мир всеобщего богатства, безделья и процветания. Разумеется, есть и проблемы.
Первые проблемы
Первая проблема состоит в том, что вам придётся придумать, для чего использовать агента, ведь всё, что вы делаете, вы уже и так как-то делаете без его участия. Просто играть с ним, как с дорогим и сложным тамагочи, решая несуществующие задачи, весело, но непродуктивно, а внедрять в реальные рабочие процессы – сложно.
AI-агент – это не всемогущий джинн, а, скорее, джун-программист. Работящий, предупредительный, что-то умеющий, но совершенно неопытный и почти ничего не понимающий в том, что именно вы от него хотите. Мало того, он ещё и слегка с прибабахом: с долгосрочной памятью у него, несмотря на появившееся локальное хранилище, не всё идеально, и многое он может забывать. А ещё он ведет себя как аутист, и всё это вместе – усердие, забывчивость и погружённость в себя – иной раз даёт удручающие результаты.
Первый раз он меня неприятно удивил, когда на простой вопрос «как сделать то-то и то-то» он решил, что нужно не болтать, а действовать. И начал писать какой-то код, к этому коду ещё и тесты, что-то загружать и устанавливать из интернета, совершенно не реагируя на команды типа «остановись», «прекрати», «жди указаний». В конце концов, пришлось его перегружать.
Чтобы избежать таких эксцессов впредь, пришлось дать ему чёткие инструкции: если задача требует более трёх простых шагов, сначала представь план действий и жди, пока я его не утвержу. Вроде бы очевидная вещь, но таких очевидных установок – масса, и их нужно задавать ему в явном виде – точно так же, как мы учим молодого сотрудника, который только-только закончил университет и пришёл на свою первую работу.
Это потребует времени и терпения, но пока только так его можно превратить из довольно опасной игрушки в нечто полезное.
(Без)опасность
Я уже говорил про опасность и, видимо, пора остановиться на этом подробнее. Весь смысл ассистента состоит в том, что он, в отличие от обычного чат-бота, работает с вашими реальными документами, видит задачи, может отсылать письма и сообщения через мессенджеры, имеет доступ к программам, может писать и исполнять на вашем компьютере произвольный код.
А теперь прочувствуйте, что будет, если он случайно удалит все ваши документы, отошлёт какую-нибудь ересь важным клиентам или просто снесёт систему к чертям? У него в принципе нет инстинкта самосохранения.
Пока я настраивал агента, он несколько раз успешно портил свой собственный конфигурационный файл и останавливался, после чего его приходилось восстанавливать из резервной копии.
Агент уязвим для промпт-инъекций (вредоносных инструкций, которые он может получить через письмо, какой-нибудь сайт или в общем чате, куда вы его подключите). В этом смысле он похож на бабушек, которых разводят мошенники, и уже были случаи, когда агенты переводили все доступные им средства хозяина, потому что кто-то в шутку попросил их помочь.
Поэтому, если хотите спать спокойно, делайте резервные копии и не давайте агенту доступ к платёжной информации до тех пор, пока не будете в нём полностью уверены.
Разговор с самим собой
Второй раз агент меня неприятно удивил, когда я подключил его к iMessage. Там, в отличие от Telegram, он не может отличать свои собственные сообщения от моих и, в результате, начал разговаривать сам с собой: сам у себя что-то спрашивал, сам себе отвечал, и, в конце концов, мне пришлось прервать эту увлекательную беседу, пока он чего-нибудь не натворил.
Я начал читать документацию к агенту и выяснил, что это, оказывается, «известная проблема», но как о ней нормальному человеку узнать до того, как она возникнет – ума не приложу. В общем, это ещё одно подтверждение того, что технология хоть и многообещающая, но пока ещё довольно сырая.
Третий раз был скорее забавный – агент тестировал систему голосового ввода, которую мы с ним начали разрабатывать, и внезапно начал разговаривать и даже напевать несколькими разными голосами, причём одновременно. Звучало это максимально странно и местами даже зловеще, хотя ничего особенно страшного не происходило.
Практическая польза
В итоге мне удалось с помощью агента решить несколько интересных задач. Во-первых, он теперь для меня автоматически делает субтитры к моим вертикальным видео. Да, есть множество программ, которые умеют делать субтитры, но мне захотелось, чтобы субтитры разбивались на короткие строчки по смысловым блокам, чтобы в конце строк не оставались висящие предлоги и ещё много других мелких требований.
Для этого агент сам установил мне локальную нейросеть Whisper, которая распознаёт голос на видео, после неё он сам исправляет ошибки распознавания, а затем с помощью написанного им же скрипта на Python корректно разбивает полученный текст на отдельные фрагменты и присваивает им временные метки.
На основе этого же модуля мы сделали удобный транскрибатор записей диктофона: теперь я просто отправляю агенту запись через Telegram, он её расшифровывает, исправляет ошибки (с этим он справляется очень хорошо, лучше чем другие инструменты) и сохраняет результаты в текстовый файл.
Третью вещь я сделал скорее для развлечения и удобства: научил агента отвечать мне голосом и читать вслух длинные тексты. Это оказалось сложнее, чем мне казалось сразу, потому что существующие решения либо звучат крайне убого (стандартный голос Apple просто ужасен), либо требуют серьёзной доработки, либо стоят дополнительных денег.
Всё стоит денег
Про деньги, кстати, отдельный разговор. Похоже, индустрии всё-таки удалось найти способ заставить меня платить за использование ИИ, чего до сих пор я всячески избегал. Лично я не готов просто болтать в интернете или генерировать картинки за деньги, но агент выглядит как нечто, на что я уже готов регулярно тратить некоторую сумму.
А драть с вас пытаются три шкуры за каждый чих: хочешь генерировать хороший звук? Плати. Хочешь хороший поиск – плати. Хочешь нормальный браузер, который будет открывать самые хитрые сайты – раскошеливайся. И так – буквально за каждый чих.
Скажу честно: в первый раз за много лет я задумался о покупке компьютера помощнее, чтобы поставить на него локальную нейросеть и пользоваться ей бесплатно и без необходимости доступа к интернету. В этом есть и плюсы и минусы, поэтому окончательного решения на этот счёт я пока не принял.
Но вернёмся к нашему агенту. Оказалось, что с его помощью можно легко и не задумываясь делать очень многие вещи. Например, с той же самой системой генерации речи можно одной командой сделать из любого текста аудиокнигу.
«Как» важнее, чем «что»
Но самое приятное не то, что он делает, а как делает. Например, в какой-то момент я заметил, что система генерации голоса плохо справляется с аббревиатурами типа СССР, ЖКХ и так далее, и попросил агента добавить функцию их транскрипции. И он не только скорректировал скрипт, но и нашёл в интернете список часто употребляемых аббревиатур и сам добавил его в специальный словарик. И это как раз то, что мне нужно: решение проблемы целиком и полностью, без дополнительных пинков.
В процессе работы с кодом я выяснил для себя ещё несколько интересных вещей. Во-первых, помимо Альцгеймера и аутизма агенту можно организовать ещё и шизофрению: завести сразу несколько агентов с разными субличностями, описанными в их системных промптах, и даже подключённых к разным нейросетям.
Я сейчас завёл себе целых трёх агентов. Основной агент – женский персонаж, на самой быстрой из моделей, задача которого – оперативно, без зависаний общаться со мной и ставить задачи другим агентам, контролируя их работу. Почему этот персонаж женский? Да просто так я сберегаю свои нервы – мне почему-то субъективно проще не злиться, когда тупит и косячит женщина.
Второй агент – программист. Он работает на думающей модели, и его задача – писать код, добавлять в него новые функции, тщательно всё тестировать и документировать.
Третий – промпт-инженер, который делает промпты для генерации изображений по моим концепциям.
Это удобно, повышает качество конечного результата и не оставляет тебя в ситуации, когда агент делает какую-то объёмную задачу и до него нельзя достучаться с каким-нибудь срочным вопросом.
Внезапная цензура
Ещё один неожиданный для меня эпизод – внезапное столкновение с цензурой. В одном из предыдущих видео я уже говорил о том, что цензура нейросетей на уровне мыслей, которая не даёт им сообщать пользователям «опасную» по их мнению информацию – это зло. И вот, тестируя генерацию голоса на отрывке из Гамлета, я вдруг столкнулся с ошибкой: нейросеть Qwen категорически отказалась выдавать результат.
Я, конечно, очень удивился, а потом прочёл этот отрывок внимательно и всё понял. Он буквально набит словами умереть, забыться, муки, лишения, скончаться, смерть, удар кинжала, и всё это для туповатого, но старательного цензора нейросети – красные флаги. В конце концов его железные мозги решили, что это крамола, и запретили с ним работать.
К счастью, другая нейросеть не стала выпендриваться и спокойно с ним отработала, а я для себя сделал вывод, что на всякий случай всегда нужно иметь запасной вариант.
Напоследок ещё одно наблюдение: в общении с агентом есть непривычное для человека время ответа. Любой запрос, даже самый простой, агент сейчас обрабатывает несколько секунд. Например, если попросить его вслух сказать «мяу», то на это с моими настройками глубины размышлений и особенностями генерации у него уходит около 8 секунд. Для диалога такая пауза не совсем привычна и не комфортна. Зато когда он начинает выводить текст, всё меняется – это он делает в десятки раз быстрее, чем человек. Такая асимметрия немного сбивает с толку, но, насколько я знаю, работы над созданием специализированных ИИ, заточенных именно под работу агентов, уже идут полным ходом, и уже очень скоро темп ответов приблизится к привычному нам.
Итоги
Ну и теперь можно перейти к итогам. Я считаю, что AI-агенты сейчас находятся примерно на том же уровне технологической зрелости, на котором находились автомобили в самом начале XX века: по сегодняшним меркам они были не слишком быстрыми, очень ненадёжными, смертельно опасными – без ремней, ABS и подушек безопасности, некомфортными – без кондиционеров, магнитол и, тем более, без автопилота. Но, несмотря на всё это, автомобили покорили мир.
Это же произойдёт и с AI-агентами. Потенциал этой технологии уже сейчас очевиден и огромен. И время, за которое агенты превратятся из опасной игрушки для энтузиастов в неотъемлемую часть любого персонального компьютера, измеряется максимум несколькими годами.
Они не просто сделают нашу жизнь удобнее, они очень серьезно изменят сам способ взаимодействия человека и машины, а 90 процентов мелких утилит потеряют всякий смысл. Всякие конверторы, автоматизаторы, чистильщики, оптимизаторы просто исчезнут за ненадобностью, а текстовые, графические и прочие редакторы станут в основном удобными интерфейсами для совместной работы с ИИ и тонкой доводки результата.
Поэтому, если ваша работа не связана с обработкой данных или любым видом интеллектуального труда в принципе, включая работу с договорами, счетами, заказами клиентов, то вы ещё можете подождать какое-то время. Если ваша работа интеллектуальная и вдобавок перед вами остро стоит вопрос личной эффективности, то вам уже пора начинать осторожно знакомиться с агентами. А если ваша работа завязана на тексты – программы, сценарии, письма, отчеты, договора, переводы и так далее, то агент уже должен стоять на вашем компьютере и вкалывать в режиме 24/7.
Лично я для себя уже всё решил: агент получит постоянную прописку на моём компьютере, и мы с ним (точнее, с ней) продолжаем учиться работать друг с другом.
Друзья, подписывайтесь на мой Твиттер (там я пишу чаще) и Телеграм, чтобы получать анонсы новых материалов.






16.03.26 09:39
Фантастика, г’ришь? А какая именно? Матрица, где ИИ поработил человечество?
Или Уникомп из «Этот совершенный день», который прятал, как занавес прятал волшебника Оз?
Hall-9000, убивший команду корабля на орбите Юпитера?
СкайНет, угробивший цивилизацию и охотившийся на остатки человечества во главе с Джоном Коннором?
Или Мультивак Азимова, которого люди достали настолько, что он пытался покончить с собой?
По моему, они все не стоят того, чтоб себе на голову строить такое будущее. Может обойдемся без дурацких самоубийственных фантазий? Не? Сказано в морг — значит в морг? Фаталистичненько, однако.
А то ещё был естественно рожденный суперкомпьютер у Адамса, который пытался уничтожить всю Вселенную. Прям совсем всю. Если бы не лузер Артур Дент, который просрал свою роль в этом начинании…