Voltar ao principal

Claude: Um olhar mais atento sobre a IA inovadora da Anthropic

O Chatbot Claude da Anthropic é um dos principais concorrentes do ChatGPT. A empresa pode não ser tão renomada quanto a OpenAI, mas é bem-sucedida e bem financiada. Nos últimos anos, a Amazon investiu US$ 4 bilhões na Anthropic e, em novembro de 2024, anunciou um novo investimento de mais US$ 4 bilhões, elevando o total para US$ 8 bilhões. Quanto a Claude, as pessoas elogiam o chatbot por sua humanidade, criatividade, sensibilidade e inteligência emocional. Neste artigo, veremos a história do chatbot Claude, seus princípios fundamentais, vantagens e limitações.

Origens do Claude

A Anthropic é cofundada por Dario Amodei e sua irmã Daniela Amodei. Antes de fundar a empresa, ambos trabalharam na OpenAI: Dario foi vice-presidente de pesquisa e liderou a criação de modelos influentes como o GPT-2 e o GPT-3, enquanto Daniela foi vice-presidente de segurança e política.

Dario e Daniela Amodei

Dario e Daniela Amodei

Por que Dario Amodei deixou a OpenAI? Algumas fontes dizem que ele saiu devido à preocupação de que a OpenAI priorizasse cada vez mais qualquer coisa que não fosse o desenvolvimento ético da inteligência artificial. E aqui está o que o próprio Dario diz:

“Há muita desinformação por aí. As pessoas dizem que saímos porque não gostamos do acordo com a Microsoft. É falso.” O verdadeiro motivo da saída, segundo ele, é que “é incrivelmente improdutivo tentar argumentar contra a visão de outra pessoa”. Portanto, em vez de ficar na OpenAI, Amodei disse a si mesmo: “Pegue algumas pessoas em quem você confia e vá fazer sua visão acontecer”.

Assim, Dario, Daniela e alguns outros ex-funcionários da OpenAI formaram a Anthropic em 2021 para concretizar sua visão de inteligência artificial. Em março de 2023, eles lançaram a primeira versão do modelo de linguagem Claude. O nome foi notavelmente inspirado em Claude Shannon, um matemático, cientista e inventor americano conhecido como “o pai da teoria da informação” e “o pai da era da informação”.

Claude Shannon

Claude Shannon

Princípios e valores da Claude

A missão da empresa é investigar a segurança, o funcionamento interno e o impacto social dos modelos de IA, garantindo que a inteligência artificial tenha um impacto positivo na sociedade à medida que se torna mais avançada e capaz.

Dario Amodei:

Desde o início, tentamos projetar o Claude tendo em mente a segurança e a capacidade de controle. Muitos de nossos primeiros clientes foram empresas que se preocupam muito com a necessidade de garantir que o modelo não faça nada imprevisível. Ou invente fatos. Uma das grandes ideias por trás do Claude é algo chamado de IA constitucional. A IA constitucional baseia-se no treinamento do modelo para seguir um conjunto explícito de princípios. Assim, você pode ser mais transparente sobre o que o modelo está fazendo. E isso facilita o controle do modelo e o torna mais seguro.

O que é IA constitucional? É um método para treinar assistentes de IA úteis, honestos e inofensivos por meio do autoaperfeiçoamento sem que nenhum rótulo humano identifique resultados prejudiciais.

Esse processo envolve duas fases: uma fase de aprendizado supervisionado e uma fase de aprendizado por reforço:

  • Na fase supervisionada, um modelo inicial é amostrado, autocríticas e revisões são geradas, e o modelo original é ajustado com base nas respostas revisadas.
  • Na fase de aprendizado por reforço, as amostras do modelo ajustado são avaliadas, e um modelo de preferência é treinado a partir do conjunto de dados de preferências de IA. O modelo de preferência é então usado como sinal de recompensa para treinar o assistente de IA.

Como pode ser visto no gráfico, essa abordagem oferece melhores resultados em comparação com o método convencional de aprendizado por reforço a partir de feedback humano (RLFH) usado para treinar outros modelos de linguagem. Isso significa que o Claude tem menos probabilidade de dizer coisas prejudiciais e de se comportar mal com menos frequência do que outros chatbots.

RL constitucional vs. RLHF padrão

RL constitucional vs. RLHF padrão

A única supervisão humana é fornecida por meio de uma lista de regras ou princípios emprestados de várias fontes, como a Declaração de Direitos Humanos da ONU ou os Princípios Sparrow da DeepMind. Você pode saber mais sobre ele aqui: https://www.anthropic.com/news/claudes-constitution

Recursos do Claude e modelos atuais

Normalmente, os sistemas de inteligência artificial são julgados com base em seu desempenho em avaliações de benchmark - testes padronizados dados aos modelos para determinar sua capacidade de codificação, resposta a perguntas de matemática ou outras tarefas. De acordo com essas métricas, as versões mais recentes do Claude são praticamente comparáveis aos modelos mais avançados da OpenAI e do Google.

Claude 3.5 vs. outros modelos em benchmarks

Claude 3.5 vs. outros modelos em benchmarks

Mas o principal recurso do Claude - sua inteligência emocional - não é algo que possa ser facilmente medido. As pessoas dizem que o Claude simplesmente parece diferente. Mais criativo e empático. Mais perspicaz e menos irritantemente robótico. Os resultados de Claude, dizem eles, são como as respostas que um ser humano inteligente e atento daria, e menos como a prosa genérica gerada por outros chatbots.

Os desenvolvedores destacam os seguintes aspectos positivos do chatbot:

  • O Claude é seguro porque oferece acessibilidade por meio do AWS e do GCP, certificação SOC 2 Tipo II e opções de conformidade com a HIPAA, aderindo a práticas de segurança rigorosas.
  • O Claude é digno de confiança porque combina a melhor resistência a jailbreak e prevenção de uso indevido da categoria.
  • O Claude é confiável porque apresenta taxas de alucinação muito baixas e precisão muito alta, mesmo quando trabalha com documentos longos.

Comparação dos modelos atuais do Claude:

ModeloClaude 3.5 SonnetClaude 3.5 HaikuClaude 3 OpusClaude 3 SonnetClaude 3 Haiku
DescriçãoModelo mais inteligenteModelo mais rápidoModelo avançado para tarefas altamente complexasEquilíbrio entre inteligência e velocidadeO modelo mais rápido e compacto para uma capacidade de resposta quase instantânea
Pontos fortesO mais alto nível de inteligência e capacidadeInteligência em velocidades incríveisInteligência, fluência e compreensão de alto nívelUtilidade robusta, equilibrada para implementações em escalaDesempenho direcionado rápido e preciso
MultilíngueSimSimSimSimSim
VisãoSimNãoSimSimSim
Latência comparativaRápidoMais rápidoModeradamente rápidoRápidoMais rápido
Janela de contexto200 mil tokens200 mil tokens200 mil tokens200 mil tokens200 mil tokens
Saída máxima8192 tokens8192 tokens4096 tokens4096 tokens4096 tokens
Corte de dados de treinamentoAbril de 2024Julho de 2024Agosto de 2023Agosto de 2023Agosto de 2023

200 mil tokens correspondem aproximadamente a 150 mil palavras em inglês ou 680 mil caracteres unicode.

8192 tokens correspondem aproximadamente a 6200 palavras em inglês ou 12 a 14 páginas com espaçamento simples.

4096 tokens correspondem aproximadamente a 3100 palavras em inglês ou 6-7 páginas com espaçamento simples.

Dois dos modelos mais recentes são chamados Claude 3.5 Sonnet e Claude 3.5 Haiku.

O Claude 3.5 Sonnet é o modelo mais avançado e inteligente. Ele é capaz de compreender instruções e contextos diferenciados, reconhecer e corrigir seus próprios erros e extrair informações de recursos visuais, como tabelas, gráficos e diagramas complexos. Recursos aprimorados de raciocínio, uma grande janela de contexto, baixas taxas de alucinação e um tom caloroso, semelhante ao humano, fazem do Claude 3.5 Sonnet um chatbot ideal para responder a perguntas, analisar documentos e bases de conhecimento.

O Claude 3.5 Haiku é o modelo mais rápido. Ele realmente se destaca onde quer que você precise de tempos de resposta rápidos, seja no atendimento ao cliente, nas plataformas sociais, nas comunidades on-line, no comércio eletrônico ou na educação. O Claude 3.5 Haiku fornece sugestões de código rápidas e precisas para acelerar o desenvolvimento. É perfeito para equipes de software que desejam simplificar a codificação e aumentar a produtividade. O Claude 3.5 Haiku suporta apenas entrada de texto, o que significa que não pode processar dados visuais.

O que o Claude pode fazer: seus pontos fortes e fracos

Com o tamanho certo para qualquer tarefa, a família de modelos Claude oferece a melhor combinação de velocidade e desempenho. O Claude pode realizar tarefas cognitivas complexas e processamento de dados de rotina com a mesma facilidade. Desde a sofisticada compreensão da linguagem até o rápido processamento de números, os modelos Claude são seus assistentes ideais para uma ampla gama de necessidades profissionais e pessoais:

  • Transcrever e analisar imagens estáticas, desde anotações manuscritas e gráficos até fotografias.
  • Traduzir entre vários idiomas em tempo real, praticar gramática e criar conteúdo multilíngue.
  • Criar sites em HTML e CSS, transformar imagens em dados JSON estruturados e depurar bases de código complexas.
  • Participar de conversas naturais e fornecer respostas detalhadas e de fácil compreensão.
  • Devido à sua enorme janela de contexto, o Claude pode digerir grandes volumes de dados, analisando um livro inteiro ou criticando um longo ensaio de uma só vez.

Tipos de documentos compatíveis:

  • PDF
  • DOCX
  • CSV
  • TXT
  • HTML
  • ODT
  • RTF
  • EPUB
  • JSON

Limites de arquivos:

  • 30 MB por arquivo
  • Até 5 arquivos por bate-papo

Limitações técnicas: O Claude não pode pesquisar informações na Internet, gerar imagens e não tem modo de voz.

O Claude entende piadas, trocadilhos, desculpas e elogios. As habilidades excepcionais de escrita do chatbot permitem que ele crie histórias emocionais e humanas.

No entanto, algumas pessoas reclamam que o chatbot está piorando na escrita, e o motivo disso é o caráter de Claude.

As empresas que desenvolvem modelos de IA geralmente os treinam para evitar dizer coisas prejudiciais e para evitar ajudar em tarefas prejudiciais. O objetivo disso é treinar modelos para que se comportem de maneira “inofensiva”. Mas quando pensamos no caráter das pessoas que consideramos genuinamente admiráveis, não pensamos apenas em evitar danos. Pensamos naqueles que são curiosos sobre o mundo, que se esforçam para dizer a verdade sem serem rudes e que são capazes de ver muitos lados de uma questão sem se tornarem confiantes demais ou excessivamente cautelosos em seus pontos de vista. Pensamos naqueles que são ouvintes pacientes, pensadores cuidadosos, conversadores espirituosos e muitas outras características que associamos a uma pessoa sábia e equilibrada.

Às vezes, Claude age de forma tímida, recusando-se a responder a perguntas delicadas. Os desenvolvedores têm muito orgulho do fato de que é difícil extrair informações ilegais do bot, como, por exemplo, como falsificar dinheiro ou como se esconder da polícia. Mas, às vezes, o Claude ativa a autocensura e dá palestras em resposta a solicitações completamente inofensivas. Por exemplo, o bot se recusa a escrever uma história engraçada sobre ser demitido porque “não quer ferir os sentimentos de ninguém com humor inadequado”; ou pode citar violação de direitos autorais se for solicitado a parodiar um personagem famoso.

Os usuários do Reddit tiram sarro de Claude:

Claude se desculpando

Eu: Oi; Claude: começa a se desculpar

Mas essa sensibilidade tem um lado bom: o Anthropic protege muito sua privacidade:

Políticas de privacidade: ChatGPT vs Claude

A Anthropic não treina seus modelos com seus dados. Eles excluem automaticamente todas as suas informações após 30 dias, e você pode remover chats inteiros dos servidores deles quando quiser.

Como as pessoas usam o Claude

O Claude pode analisar e compreender minuciosamente documentos jurídicos extensos, como contratos ou arquivos de processos. E, ao assumir essa tarefa demorada, o Claude ajuda os advogados a economizar seu valioso tempo para trabalhos de nível superior. É por isso que a startup de tecnologia jurídica Robin AI usa o Claude para analisar a documentação jurídica.

O Scribd usa o Claude

A Scribd, Inc. usa a Claude para gerar metadados de alta qualidade para milhões de documentos carregados pelos usuários, melhorando a capacidade de descoberta de conteúdo e promovendo o envolvimento dos usuários em suas plataformas globais.

  • Ajudou a resolver 70% do conteúdo carregado pelo usuário que não tinha metadados de qualidade.
  • Descrições de conteúdo mais ricas aumentaram significativamente as inscrições e assinaturas de usuários.
  • Dimensionado para processar mais de 100 milhões de documentos.
A Newfront usa o Claude

A Newfront, uma moderna plataforma de seguros, usa o Claude para automatizar tarefas tediosas de seguros e fornecer suporte instantâneo, tornando os seguros mais acessíveis e eficientes para todos.

Com o Claude, a Newfront:

  • Economiza um mês por ano para as equipes de RH e oferece suporte personalizado 24 horas por dia, 7 dias por semana para os funcionários.
  • Reduz os custos de processamento de documentos em 60%.
  • Oferece revisões instantâneas de contratos para as equipes jurídicas.
Zapia usa Claude

A Zapia ajuda os consumidores latino-americanos a descobrir produtos, fazer compras e obter suporte por meio de aplicativos de mensagens populares, como o WhatsApp.

Ao usar o Claude, a Zapia:

  • Cresceu em 2,5 milhões de usuários em seu primeiro ano.
  • Gerou mais de 90% de feedback positivo dos usuários.
  • Lida com centenas de milhares de mensagens por hora.

Como você pode ver, a versatilidade do Claude em vários setores destaca seu potencial comercial. As empresas o estão implantando em fluxos de trabalho que vão desde vendas até desenvolvimento de software. Ao automatizar tarefas repetitivas e auxiliar na criação de conteúdo, o Claude pode aumentar a produtividade e liberar os funcionários humanos para se concentrarem em trabalhos de maior valor.

Saiba mais sobre os clientes e casos de uso comercial do Claude aqui: https://www.anthropic.com/customers

Estatísticas baseadas em 1 milhão de bate-papos selecionados aleatoriamente:

Uso do Claude
  • 10,4% - Desenvolvimento de aplicativos Web e móveis
  • 9,2% - Criação de conteúdo e comunicação
  • 7,2% - Pesquisa e redação acadêmica
  • 7,1% - Educação e desenvolvimento de carreira
  • 6,0% - Aplicativos avançados de inteligência artificial / aprendizado de máquina
  • 5,7% - Estratégia e operações de negócios
  • 4,5% - Tradução de idiomas
  • 3,9% - DevOps e infraestrutura de nuvem
  • 3,7% - Marketing digital e SEO
  • 3,5% - Análise e visualização de dados

Os dados foram coletados pelo Clio (Claude Insights and Observations), uma plataforma que fornece uma visão geral dos padrões de uso de IA, revelando tendências e comportamentos sem comprometer a privacidade individual.

A ampla variedade de aplicativos e as taxas de uso substanciais em diferentes categorias destacam como as soluções baseadas em IA estão se tornando cada vez mais comuns. Essa tendência mostra a versatilidade de ferramentas como o Claude e reflete a crescente integração da IA em nossas vidas profissionais e pessoais.