Claude: пристальный взгляд на инновационный искусственный интеллект Anthropic

Чатбот Claude от Anthropic - один из главных конкурентов ChatGPT. Возможно, эта компания не так известна, как OpenAI, но она успешна и хорошо финансируется. За последние несколько лет Amazon вложила в Anthropic 4 миллиарда долларов, а в ноябре 2024 года объявила о новых инвестициях в размере еще 4 миллиардов долларов, доведя общую сумму до 8 миллиардов долларов. Что касается Claude, то люди хвалят чатбота за его человечность, креативность, чувствительность и эмоциональный интеллект. В этой статье мы рассмотрим историю создания чатбота Claude, его фундаментальные принципы, преимущества и ограничения.

История создания Claude

Соучредителями компании Anthropic являются Дарио Амодеи и его сестра Даниэла Амодеи. До основания своей компании они оба работали в OpenAI: Дарио был вице-президентом по исследованиям и руководил созданием таких влиятельных моделей, как GPT-2 и GPT-3, а Даниэла была вице-президентом по безопасности и политике.

Дарио и Даниэла Амодеи

Почему Дарио Амодеи покинул OpenAI? Некоторые источники утверждают, что он ушел из-за опасений, что OpenAI все больше отдает предпочтение чему угодно, только не этичным разработкам искусственного интеллекта. А вот что говорит сам Дарио:

«Существует много дезинформации. Люди говорят, что мы ушли, потому что нам не понравилось соглашение с Microsoft. Это ложь». По его словам, настоящая причина ухода в том, что «пытаться спорить с чужим видением невероятно непродуктивно». Поэтому вместо того, чтобы оставаться в OpenAI, Амодей сказал себе: «Возьми людей, которым ты доверяешь, и иди воплощать свое видение в жизнь».

Поэтому Дарио, Даниэла и еще несколько бывших сотрудников OpenAI создали в 2021 году компанию Anthropic, чтобы реализовать свое видение искусственного интеллекта. В марте 2023 года они выпустили первую версию языковой модели Claude. Название было навеяно именем Клода Шеннона, американского математика, ученого и изобретателя, известного как «отец теории информации» и «отец информационного века».

Клод Шеннон

Принципы и ценности компании Claude

Миссия компании - исследовать безопасность, внутреннее устройство и влияние на общество моделей искусственного интеллекта, чтобы обеспечить положительное влияние искусственного интеллекта на общество по мере того, как он становится все более совершенным и способным.

Дарио Амодеи:

Мы с самого начала старались разрабатывать Claude с учетом требований безопасности и управляемости. Многие из наших первых клиентов были предприятиями, которым важно, чтобы модель не делала ничего непредсказуемого. Или выдумывает факты. Одна из основных идей, лежащих в основе Claude, - это так называемый конституционный ИИ. Конституционный ИИ основан на обучении модели следовать явному набору принципов. Таким образом, вы можете быть более прозрачны в том, что делает модель. А это облегчает контроль над моделью и делает ее безопасной.

Что такое конституционный ИИ? Это метод обучения полезного, честного и безвредного ИИ-помощника путем самосовершенствования без каких-либо человеческих меток, выявляющих вредные результаты.

Этот процесс включает в себя две фазы - фазу контролируемого обучения и фазу обучения с подкреплением:

На этапе контролируемого обучения исходная модель берется за образец, генерируется самокритика и изменения, а исходная модель настраивается на основе измененных ответов.
На этапе обучения с подкреплением образцы из точно настроенной модели оцениваются, и на основе набора данных о предпочтениях ИИ обучается модель предпочтений. Затем модель предпочтений используется в качестве сигнала вознаграждения для обучения ИИ-ассистента.

Как видно на графике, этот подход дает лучшие результаты по сравнению с обычным методом обучения с подкреплением на основе человеческой обратной связи (RLFH), используемым для обучения других языковых моделей. Это означает, что Клод реже говорит вредные вещи и реже ведет себя неправильно, чем другие чат-боты.

Конституционный RL против стандартного RLHF

Единственный человеческий надзор осуществляется через список правил или принципов, заимствованных из различных источников, таких как Декларация прав человека ООН или Sparrow Principles от DeepMind. Подробнее об этом можно узнать здесь: https://www.anthropic.com/news/claudes-constitution

Возможности Claude и современные модели

Как правило, системы искусственного интеллекта оцениваются по результатам эталонных тестов - стандартизированных испытаний, проводимых для определения способностей моделей к кодированию, ответам на математические вопросы и другим задачам. По этим показателям последние версии Claude примерно сопоставимы с самыми мощными моделями от OpenAI и Google.

Claude 3.5 в сравнении с другими моделями в бенчмарках

Но главная особенность Claude - его эмоциональный интеллект - это не то, что можно легко измерить. Люди говорят, что Claude просто кажется другим. Более творческим и сопереживающим. Более проницательным и менее раздражающе роботизированным. По их словам, ответы Claude похожи на ответы умного, внимательного человека и не так похожи на типовую прозу, которую генерируют другие чат-боты.

Разработчики выделяют следующие положительные стороны чатбота:

Claude безопасен, поскольку обеспечивает доступность через AWS и GCP, сертификацию SOC 2 Type II и соответствие требованиям HIPAA, придерживаясь строгих практик безопасности.
Claude заслуживает доверия, поскольку сочетает в себе лучшую в своем классе устойчивость к взлому и защиту от неправомерного использования.
Claude надежен, поскольку может похвастаться очень низким уровнем галлюцинаций и очень высокой точностью, даже при работе с длинными документами.

Сравнение современных моделей Claude:

Модель	Claude 3.5 Sonnet	Claude 3.5 Haiku	Claude 3 Opus	Claude 3 Sonnet	Claude 3 Haiku
Описание	Самая интеллектуальная модель	Самая быстрая модель	Мощная модель для решения очень сложных задач	Баланс интеллекта и скорости	Самая быстрая и компактная модель, обеспечивающая практически мгновенное реагирование
Сильные стороны	Высочайший уровень интеллекта и возможностей	Интеллект на молниеносной скорости	Интеллект, беглость и понимание на высшем уровне	Высокая практичность, сбалансированность для масштабных развертываний	Быстрое и точное выполнение заданий
Многоязычный	Да	Да	Да	Да	Да
Видение	Да	Нет	Да	Да	Да
Сравнительная задержка	Быстрый	Самый быстрый	Умеренно быстрый	Быстрый	Самый быстрый
Контекстное окно	200 тысяч токенов	200 тысяч токенов	200 тысяч токенов	200 тысяч токенов	200 тысяч токенов
Максимальная производительность	8192 токенов	8192 токенов	4096 токенов	4096 токенов	4096 токенов
Отсечение обучающих данных	Апрель 2024 года	Июль 2024 года	Август 2023 года	Август 2023 года	Август 2023 года

200 тысяч токенов примерно соответствуют 150 тысячам английских слов или 680 тысячам символов юникода.

8192 токена примерно соответствуют 6200 английским словам или 12-14 страницам с одинарным интервалом.

4096 токенов примерно соответствуют 3100 английским словам или 6-7 страницам с одинарным интервалом.

Две новейшие модели называются Claude 3.5 Sonnet и Claude 3.5 Haiku.

Claude 3.5 Sonnet - самая мощная и интеллектуальная модель. Она способна понимать тонкие инструкции и контекст, распознавать и исправлять собственные ошибки, извлекать информацию из визуальных объектов, таких как диаграммы, графики и сложные схемы. Расширенные возможности рассуждений, большое контекстное окно, низкий уровень галлюцинаций и теплый, человекоподобный тон - все это делает Claude 3.5 Sonnet идеальным чатботом для ответов на вопросы, анализа документов и баз знаний.

Claude 3.5 Haiku - самая быстрая модель. Он действительно хорош везде, где требуется быстрое реагирование, будь то служба поддержки клиентов, социальные платформы, онлайн-сообщества, электронная коммерция или образование. Claude 3.5 Haiku предоставляет быстрые и точные предложения по коду для ускорения разработки. Он идеально подходит для команд разработчиков, желающих упростить кодирование и повысить производительность. Claude 3.5 Haiku поддерживает только текстовый ввод, то есть не может обрабатывать визуальные данные.

На что способен Claude: его сильные и слабые стороны

Модели семейства Claude, подходящие по размеру для решения любых задач, предлагают оптимальное сочетание скорости и производительности. Claude с одинаковой легкостью выполняет сложные когнитивные задачи и рутинную обработку данных. От сложного понимания языка до быстрого подсчета цифр - модели Claude станут вашими помощниками в самых разных профессиональных и личных задачах:

Расшифровка и анализ статических изображений, от рукописных заметок и графиков до фотографий.
Переводите с одного языка на другой в режиме реального времени, занимайтесь грамматикой и создавайте многоязычный контент.
Создавайте веб-сайты на HTML и CSS, превращайте изображения в структурированные данные JSON и отлаживайте сложные кодовые базы.
Ведите естественные диалоги и давайте подробные и понятные ответы.
Благодаря огромному контекстному окну Claude может переваривать большие куски данных, анализируя целую книгу или критикуя длинное эссе за один раз.

Поддерживаемые типы документов:

PDF
DOCX
CSV
TXT
HTML
ODT
RTF
EPUB
JSON

Ограничения на файлы:

30 МБ на файл
До 5 файлов в одном чате

Технические ограничения: Claude не может искать информацию в Интернете, генерировать изображения, нет голосового режима.

Claude понимает шутки, каламбуры, извинения и комплименты. Исключительные навыки письма позволяют чатботу создавать эмоциональные, похожие на человеческие, истории.

Однако некоторые люди жалуются, что чатбот стал хуже писать, и причиной тому - характер Claude.

Компании, разрабатывающие модели ИИ, обычно обучают их не говорить вредных вещей и не помогать в выполнении вредных задач. Цель этого - научить модели вести себя «безвредно». Но когда мы думаем о характере тех, кто вызывает у нас искреннее восхищение, мы думаем не только об избегании вреда. Мы думаем о тех, кто любопытен к миру, кто стремится говорить правду, не будучи недобрым, и кто способен увидеть множество сторон вопроса, не становясь самоуверенным или слишком осторожным в своих взглядах. Мы думаем о тех, кто терпеливо слушает, тщательно продумывает свои мысли, является остроумным собеседником и обладает многими другими качествами, которые ассоциируются у нас с мудрым и всесторонне развитым человеком.

Временами Claude ведет себя робко, отказываясь отвечать на щекотливые вопросы. Разработчики очень гордятся тем, что из бота сложно извлечь незаконную информацию, например, как подделать деньги или как скрыться от полиции. Но иногда Claude включает самоцензуру и читает лекции в ответ на совершенно безобидные просьбы. Например, бот отказывается писать смешную историю об увольнении, потому что «не хочет задеть чьи-то чувства неуместным юмором»; или может сослаться на нарушение авторских прав, если его попросят спародировать известного персонажа.

Пользователи Reddit смеются над Claude:

Я: Привет; Claude: начинает извиняться

Но у этой деликатности есть и хорошая сторона - Anthropic очень бережно относится к вашей частной жизни:

Политика конфиденциальности: ChatGPT против Claude

Anthropic не обучает свои модели на ваших данных. Они автоматически удаляют всю вашу информацию через 30 дней, и вы можете удалить все чаты с их серверов в любое время.

Как люди используют Claude

Claude может тщательно просмотреть и осмыслить объемные юридические документы, такие как контракты или материалы дела. Взяв на себя эту трудоемкую задачу, Claude помогает юристам сэкономить свое драгоценное время для более важной работы. Именно поэтому стартап Robin AI, специализирующийся на юридических технологиях , использует Claude для анализа юридических документов.

Компания Scribd, Inc. использует Claude для создания высококачественных метаданных для миллионов загружаемых пользователями документов, улучшая открываемость контента и повышая вовлеченность пользователей на своих глобальных платформах.

Помогло решить проблему 70 % загружаемого пользователями контента, которому не хватало качественных метаданных.
Более богатые описания контента значительно увеличили количество подписок и регистраций пользователей.
Масштабирование позволило обработать более 100 миллионов документов.

Newfront, современная страховая платформа, использует Claude для автоматизации утомительных задач по страхованию и обеспечения мгновенной поддержки, делая страхование более доступным и эффективным для всех.

Используя Claude, Newfront:

Экономит HR-командам один месяц в год и обеспечивает круглосуточную персонализированную поддержку сотрудников.
Сокращает расходы на обработку документов на 60 %.
Обеспечивает мгновенную проверку договоров для юридических отделов.

Zapia помогает латиноамериканским потребителям находить товары, совершать покупки и получать поддержку через популярные приложения для обмена сообщениями, такие как WhatsApp.

Используя Claude, Zapia:

Выросли на 2,5 миллиона пользователей за первый год.
Получила более 90 % положительных отзывов пользователей.
Обрабатывает сотни тысяч сообщений в час.

Как видите, универсальность Claude в разных отраслях подчеркивает его коммерческий потенциал. Компании используют его в различных рабочих процессах - от продаж до разработки программного обеспечения. Автоматизируя повторяющиеся задачи и помогая создавать контент, Claude позволяет повысить производительность и освободить сотрудников, чтобы они могли сосредоточиться на более важной работе.

Узнать о клиентах и коммерческих примерах использования Claude можно здесь: https://www.anthropic.com/customers.

Статистика основана на 1 миллионе случайно выбранных чатов:

10,4% - Разработка веб- и мобильных приложений
9,2% - Создание контента и коммуникация
7,2% - Академические исследования и написание текстов
7,1% - Образование и развитие карьеры
6,0% - Передовые приложения искусственного интеллекта / машинного обучения
5,7% - Бизнес-стратегии и операции
4,5% - Языковой перевод
3,9% - DevOps и облачная инфраструктура
3,7% - Цифровой маркетинг и SEO
3,5% - Анализ и визуализация данных

Данные были собраны Clio (Claude Insights and Observations), платформой, которая предоставляет обзор моделей использования ИИ, выявляя тенденции и поведение без ущерба для конфиденциальности личности.

Широкое разнообразие приложений и значительные показатели использования в различных категориях свидетельствуют о том, что решения на базе ИИ становятся все более распространенными. Эта тенденция демонстрирует универсальность таких инструментов, как Claude, и отражает растущую интеграцию ИИ в нашу профессиональную и личную жизнь.