Claude : Gros plan sur l'IA innovante d'Anthropic

Le Chatbot Claude d'Anthropic est l'un des principaux concurrents de ChatGPT. L'entreprise n'est peut-être pas aussi renommée qu'OpenAI, mais elle est prospère et bien financée. Au cours des dernières années, Amazon a investi 4 milliards de dollars dans Anthropic et, en novembre 2024, elle a annoncé un nouvel investissement de 4 milliards de dollars supplémentaires, ce qui porte le total à 8 milliards de dollars. Quant à Claude, les gens font l'éloge du chatbot pour son humanité, sa créativité, sa sensibilité et son intelligence émotionnelle. Dans cet article, nous allons nous pencher sur l'histoire du chatbot Claude, ses principes fondamentaux, ses avantages et ses limites.

Les origines de Claude

Anthropic est cofondée par Dario Amodei et sa sœur Daniela Amodei. Avant de fonder leur entreprise, ils ont tous deux travaillé chez OpenAI : Dario était vice-président de la recherche et a dirigé la création de modèles influents tels que GPT-2 et GPT-3, tandis que Daniela était vice-présidente de la sécurité et de la politique.

Dario et Daniela Amodei

Pourquoi Dario Amodei a-t-il quitté l'OpenAI ? Certaines sources affirment qu'il est parti parce qu'il craignait que l'OpenAI ne donne de plus en plus la priorité à tout autre chose qu'au développement éthique de l'intelligence artificielle. Voici ce que dit Dario lui-même :

« Il y a beaucoup de désinformation. Les gens disent que nous sommes partis parce que nous n'aimions pas l'accord avec Microsoft. C'est faux. La véritable raison de notre départ, dit-il, est qu'« il est incroyablement improductif d'essayer de discuter de la vision de quelqu'un d'autre ». Plutôt que de rester à OpenAI, Amodei s'est donc dit : « Prenez des gens en qui vous avez confiance et réalisez votre vision. »

Dario, Daniela et quelques autres anciens employés d'OpenAI ont donc créé Anthropic en 2021 pour concrétiser leur vision de l'intelligence artificielle. En mars 2023, ils ont publié la première version du modèle de langage Claude. Le nom est notamment inspiré de Claude Shannon, un mathématicien, scientifique et inventeur américain connu comme « le père de la théorie de l'information » et « le père de l'ère de l'information ».

Claude Shannon

Principes et valeurs de Claude

La mission de l'entreprise est d'étudier la sécurité, le fonctionnement interne et l'impact sociétal des modèles d'IA, en veillant à ce que l'intelligence artificielle ait un impact positif sur la société au fur et à mesure qu'elle devient plus avancée et plus performante.

Dario Amodei:

Dès le départ, nous avons essayé de concevoir Claude en tenant compte de la sécurité et de la contrôlabilité. Beaucoup de nos premiers clients étaient des entreprises qui se souciaient beaucoup de s'assurer que le modèle ne fasse rien d'imprévisible. Ou qu'il n'invente pas de faits. L'une des grandes idées qui sous-tendent Claude est ce que l'on appelle l'IA constitutionnelle. L'IA constitutionnelle est basée sur l'entraînement du modèle à suivre un ensemble explicite de principes. Il est ainsi possible d'être plus transparent sur ce que fait le modèle. Il est ainsi plus facile de contrôler le modèle et de le rendre sûr.

Qu'est-ce que l'IA constitutionnelle ? Il s'agit d'une méthode de formation d'assistants IA utiles, honnêtes et inoffensifs par le biais de l'auto-amélioration, sans qu'aucune étiquette humaine n'identifie les résultats nuisibles.

Ce processus comporte deux phases : une phase d'apprentissage supervisé et une phase d'apprentissage par renforcement :

Dans la phase d'apprentissage supervisé, un modèle initial est échantillonné, des autocritiques et des révisions sont générées, et le modèle original est affiné sur la base des réponses révisées.
Dans la phase d'apprentissage par renforcement, les échantillons du modèle affiné sont évalués et un modèle de préférence est formé à partir de l'ensemble de données des préférences de l'IA. Le modèle de préférence est ensuite utilisé comme signal de récompense pour former l'assistant IA.

Comme le montre le graphique, cette approche donne de meilleurs résultats que la méthode conventionnelle d'apprentissage par renforcement à partir du feedback humain (RLFH) utilisée pour former d'autres modèles linguistiques. Cela signifie que Claude est moins susceptible de dire des choses nuisibles et se comporte moins souvent mal que les autres chatbots.

RL constitutionnel vs RLHF standard

Le seul contrôle humain est assuré par une liste de règles ou de principes empruntés à diverses sources, telles que la Déclaration des droits de l'homme des Nations unies ou les principes Sparrow de DeepMind. Pour en savoir plus, cliquez ici : https://www.anthropic.com/news/claudes-constitution

Caractéristiques de Claude et modèles actuels

En règle générale, les systèmes d'intelligence artificielle sont jugés sur la base de leurs performances lors d'évaluations de référence, c'est-à-dire des tests standardisés administrés aux modèles pour déterminer leur capacité à coder, à répondre à des questions de mathématiques ou à effectuer d'autres tâches. Selon ces critères, les dernières versions de Claude sont à peu près comparables aux modèles les plus puissants d'OpenAI et de Google.

Claude 3.5 par rapport à d'autres modèles dans les benchmarks

Mais la caractéristique principale de Claude - son intelligence émotionnelle - n'est pas quelque chose de facilement mesurable. Les gens disent que Claude se sent différent. Plus créatif et plus empathique. Plus perspicace et moins robotique. Les réponses de Claude, disent-ils, ressemblent à celles que donnerait un humain intelligent et attentif, et moins à la prose générique générée par d'autres chatbots.

Les développeurs soulignent les aspects positifs suivants du chatbot :

Claude est sûr car il offre une accessibilité via AWS et GCP, une certification SOC 2 Type II et des options de conformité HIPAA, adhérant ainsi à des pratiques de sécurité rigoureuses.
Claude est digne de confiance parce qu'il combine la meilleure résistance au jailbreak de sa catégorie et la prévention des abus.
Claude est fiable car il affiche des taux d'hallucination très faibles et une très grande précision, même lorsqu'il s'agit de longs documents.

Comparaison des modèles actuels de Claude :

Modèle	Claude 3.5 Sonnet	Claude 3.5 Haiku	Claude 3 Opus	Claude 3 Sonnet	Claude 3 Haiku
Description	Modèle le plus intelligent	Modèle le plus rapide	Un modèle puissant pour des tâches très complexes	Équilibre entre intelligence et rapidité	Modèle le plus rapide et le plus compact pour une réactivité quasi instantanée
Points forts	Le plus haut niveau d'intelligence et de capacité	L'intelligence à la vitesse de l'éclair	Intelligence, aisance et compréhension de haut niveau	Forte utilité, équilibrée pour les déploiements à grande échelle	Des performances ciblées, rapides et précises
Multilingue	Oui	Oui	Oui	Oui	Oui
Vision	Oui	Non	Oui	Oui	Oui
Temps de latence comparatif	Rapide	Le plus rapide	Moyennement rapide	Rapide	Le plus rapide
Fenêtre contextuelle	200K tokens	200K tokens	200K tokens	200K tokens	200K tokens
Puissance maximale	8192 tokens	8192 tokens	4096 tokens	4096 tokens	4096 tokens
Coupure des données d'apprentissage	Avril 2024	Juillet 2024	Août 2023	Août 2023	Août 2023

200K tokens correspondent approximativement à 150K mots anglais ou 680K caractères unicode.

8192 tokens correspondent approximativement à 6200 mots anglais ou 12-14 pages à simple interligne.

4096 tokens correspondent approximativement à 3100 mots anglais ou 6-7 pages à simple interligne.

Deux des modèles les plus récents sont appelés Claude 3.5 Sonnet et Claude 3.5 Haiku.

Claude 3.5 Sonnet est le modèle le plus puissant et le plus intelligent. Il peut comprendre des instructions et un contexte nuancés, reconnaître et corriger ses propres erreurs, extraire des informations de documents visuels tels que des tableaux, des graphiques et des diagrammes complexes. Des capacités de raisonnement améliorées, une grande fenêtre contextuelle, un faible taux d'hallucination, et un ton chaleureux et humain font de Claude 3.5 Sonnet un chatbot idéal pour répondre à des questions, analyser des documents et des bases de connaissances.

Claude 3.5 Haiku est le modèle le plus rapide. Il brille vraiment partout où vous avez besoin de temps de réponse rapides, que ce soit dans le service à la clientèle, les plateformes sociales, les communautés en ligne, le commerce électronique ou l'éducation. Claude 3.5 Haiku fournit des suggestions de code rapides et précises pour accélérer le développement. Il est parfait pour les équipes logicielles qui souhaitent simplifier le codage et augmenter la productivité. Claude 3.5 Haiku ne prend en charge que la saisie de texte, ce qui signifie qu'il ne peut pas traiter les données visuelles.

Ce que Claude peut faire : ses forces et ses faiblesses

De taille adaptée à toutes les tâches, la famille de modèles Claude offre la meilleure combinaison de vitesse et de performance. Claude peut effectuer des tâches cognitives complexes et des traitements de données de routine avec la même facilité. De la compréhension d'un langage sophistiqué au traitement rapide des chiffres, les modèles Claude sont vos assistants de choix pour un large éventail de besoins professionnels et personnels :

Transcrire et analyser des images statiques, qu'il s'agisse de notes manuscrites, de graphiques ou de photographies.
Traduire en temps réel entre différentes langues, pratiquer la grammaire et créer du contenu multilingue.
Créer des sites web en HTML et CSS, transformer des images en données JSON structurées et déboguer des bases de code complexes.
Engager des conversations naturelles et fournir des réponses détaillées et facilement compréhensibles.
Grâce à son immense fenêtre contextuelle, Claude peut assimiler de grandes quantités de données, analyser un livre entier ou critiquer une longue dissertation en une seule fois.

Types de documents pris en charge :

PDF
DOCX
CSV
TXT
HTML
ODT
RTF
EPUB
JSON

Limites de fichiers :

30MB par fichier
Jusqu'à 5 fichiers par chat

Limitations techniques: Claude ne peut pas rechercher des informations sur Internet, générer des images, pas de mode vocal.

Claude comprend les blagues, les jeux de mots, les excuses et les compliments. Les compétences exceptionnelles du chatbot en matière d'écriture lui permettent de rédiger des histoires émotionnelles, semblables à celles d'un être humain.

Cependant, certaines personnes se plaignent que le chatbot est devenu moins bon à l'écrit, ce qui s'explique par le caractère de Claude.

Les entreprises qui développent des modèles d'IA les entraînent généralement à éviter de dire des choses nuisibles et à ne pas participer à des tâches nuisibles. L'objectif est d'apprendre aux modèles à se comporter de manière « inoffensive ». Mais lorsque nous pensons au caractère de ceux que nous trouvons vraiment admirables, nous ne pensons pas seulement à l'évitement du mal. Nous pensons à ceux qui sont curieux du monde, qui s'efforcent de dire la vérité sans être méchants et qui sont capables de voir plusieurs aspects d'une question sans devenir trop sûrs d'eux ou trop prudents dans leurs opinions. Nous pensons à ceux qui écoutent patiemment, qui réfléchissent attentivement, qui ont de l'esprit dans leurs conversations, et à bien d'autres traits que nous associons à une personne sage et bien équilibrée.

Parfois, Claude agit timidement, refusant de répondre à des questions délicates. Les développeurs sont très fiers du fait qu'il est difficile d'extraire des informations illégales du robot, comme la manière de contrefaire de l'argent ou de se cacher de la police. Mais il arrive que Claude s'autocensure et fasse la morale en réponse à des demandes tout à fait anodines. Par exemple, il refuse d'écrire une histoire drôle sur son licenciement parce qu'il « ne veut blesser personne avec un humour déplacé » ; ou il peut invoquer une violation du droit d'auteur si on lui demande de parodier un personnage célèbre.

Les utilisateurs de Reddit se moquent de Claude :

Moi : Bonjour ; Claude : commence à s'excuser

Mais il y a un bon côté à cette sensibilité : Anthropic est très protecteur de votre vie privée :

Politiques de confidentialité : ChatGPT vs Claude

Anthropic n'entraîne pas ses modèles sur vos données. Ils suppriment automatiquement toutes vos informations après 30 jours, et vous pouvez supprimer des chats entiers de leurs serveurs quand vous le souhaitez.

Comment les gens utilisent Claude

Claude est capable de réviser et de comprendre de longs documents juridiques, tels que des contrats ou des dossiers. En se chargeant de cette tâche fastidieuse, Claude permet aux avocats de consacrer leur temps précieux à des tâches plus importantes. C'est pourquoi la startup Robin AI utilise Claude pour analyser les documents juridiques.

Scribd, Inc. utilise Claude pour générer des métadonnées de haute qualité pour des millions de documents téléchargés par les utilisateurs, améliorant ainsi la découverte du contenu et stimulant l'engagement des utilisateurs sur ses plateformes mondiales.

A permis de traiter 70 % des contenus téléchargés par les utilisateurs qui manquaient de métadonnées de qualité.
Des descriptions de contenu plus riches ont permis d'augmenter de manière significative les inscriptions et les abonnements des utilisateurs.
Mise à l'échelle pour traiter plus de 100 millions de documents.

Newfront, une plateforme d'assurance moderne, utilise Claude pour automatiser les tâches fastidieuses liées à l'assurance et fournir une assistance instantanée, rendant l'assurance plus accessible et plus efficace pour tout le monde.

Avec Claude, Newfront :

Fait gagner un mois par an aux équipes RH et offre un soutien personnalisé 24/7 aux employés.
Réduit les coûts de traitement des documents de 60%.
Fournit des révisions de contrats instantanées pour les équipes juridiques.

Zapia aide les consommateurs latino-américains à découvrir des produits, à faire des achats et à obtenir de l'aide par le biais d'applications de messagerie populaires comme WhatsApp.

En utilisant Claude, Zapia :

A gagné 2,5 millions d'utilisateurs au cours de la première année.
A généré plus de 90 % de commentaires positifs de la part des utilisateurs.
Traite des centaines de milliers de messages par heure.

Comme vous pouvez le constater, la polyvalence de Claude dans tous les secteurs d'activité met en évidence son potentiel commercial. Les entreprises le déploient pour des flux de travail allant des ventes au développement de logiciels. En automatisant les tâches répétitives et en aidant à la création de contenu, Claude peut augmenter la productivité et libérer les travailleurs humains pour qu'ils se concentrent sur des tâches à plus forte valeur ajoutée.

Pour en savoir plus sur les clients de Claude et les cas d'utilisation commerciale, cliquez sur : https://www.anthropic.com/customers

Statistiques basées sur 1 million de chats sélectionnés au hasard :

10,4% - Développement d'applications web et mobiles
9,2% - Création de contenu et communication
7.2% - Recherche académique et rédaction
7,1% - Éducation et développement de carrière
6.0% - Applications avancées d'intelligence artificielle / apprentissage automatique
5,7% - Stratégie et opérations commerciales
4,5% - Traduction des langues
3,9% - DevOps et infrastructure cloud
3,7% - Marketing numérique et SEO
3,5% - Analyse et visualisation des données

Les données ont été collectées par Clio (Claude Insights and Observations), une plateforme qui fournit une vue d'ensemble des modèles d'utilisation de l'IA, révélant les tendances et les comportements sans compromettre la vie privée des individus.

La grande variété d'applications et les taux d'utilisation substantiels dans différentes catégories montrent que les solutions basées sur l'IA deviennent de plus en plus courantes. Cette tendance illustre la polyvalence d'outils tels que Claude et reflète l'intégration croissante de l'IA dans nos vies professionnelles et personnelles.