Claude：Anthropic社の革新的な人工知能に迫る

Anthropic社のチャットボット「Claude」は、ChatGPTの主な競合企業の1つです。同社はOpenAIほど有名ではありませんが、成功を収めており、十分な資金があります。ここ数年でAmazonはAnthropicに40億ドルを投資し、2024年11月にはさらに40億ドルの新規投資を発表し、合計80億ドルとなりました。クロードに関しては、その人間性、創造性、感受性、そして感情的知性により、人々から賞賛されているチャットボットです。本記事では、クロードチャットボットの歴史、基本原理、利点、限界について見ていきます。

クロードの起源

Anthropicは、ダリオ・アモデイ氏と彼の妹であるダニエラ・アモデイ氏によって共同設立されました。彼らは、会社を設立する前は、共にOpenAIで働いていました。ダリオ氏は研究担当副社長として、GPT-2やGPT-3などの影響力のあるモデルの作成を主導し、ダニエラ氏は安全および政策担当副社長でした。

ダリオとダニエラ・アモデイ

ダリオ・アモデイはなぜOpenAIを去ったのでしょうか？いくつかの情報源によると、OpenAIが倫理的な人工知能の開発以外のことを優先するようになったことを懸念して、彼は退社したと言われています。ダリオ本人は次のように述べています。

「誤った情報がたくさん出回っています。私たちがマイクロソフトとの契約を嫌って去ったと言う人もいますが、それは誤りです。」彼が言うには、去った本当の理由は、「他者のビジョンに異を唱えようとしても、信じられないほど非生産的だから」だ。だから、OpenAIに残るよりも、「信頼できる何人かの仲間を集めて、自分のビジョンを実現しよう」とアモデイは自分に言い聞かせた。

そこでダリオ、ダニエラ、そして数名の他の元OpenAI社員は、2021年にAnthropicを設立し、人工知能のビジョンを実現しようとしました。2023年3月、彼らはClaude言語モデルの最初のバージョンをリリースしました。この名称は、情報理論の父」や「情報時代の父」として知られるアメリカの数学者、科学者、発明家であるクロード・シャノンにちなんで名付けられました。

クロード・シャノン

Claudeの原則と価値観

同社の使命は、人工知能モデルの安全性、内部構造、社会への影響を調査し、人工知能がより高度で高性能になるにつれ、社会にプラスの影響をもたらすことを確実にしていくことです。

ダリオ・アモデイ：

私たちは当初から、安全性と制御性を念頭に置いてClaudeを設計しようとしてきました。初期のお客様の多くは、予測不可能なことをしないようにモデルを確実にすることに非常に気を遣う企業でした。あるいは、事実をでっち上げないようにすることです。Claudeの背景にある大きなアイデアの1つは、憲法上の人工知能と呼ばれるものです。憲法上の人工知能は、明確な一連の原則に従うようにモデルを訓練することに基づいています。そのため、モデルが何をしているのかについて、より透明性を確保することができます。これにより、モデルを制御し、安全性を確保することが容易になります。

憲法上の人工知能とは何ですか？これは、有害なアウトプットを特定する人間のラベル付けを一切行わずに、自己改善を通じて、有益で誠実かつ無害な人工知能アシスタントを訓練する方法です。

このプロセスには、教師あり学習フェーズと強化学習フェーズの2つのフェーズが含まれます。

教師あり学習フェーズでは、初期モデルがサンプリングされ、自己批判と修正が行われ、修正された応答に基づいて元のモデルが微調整されます。
強化学習フェーズでは、微調整されたモデルからのサンプルが評価され、人工知能の好みのデータセットから好みモデルが訓練されます。好みモデルは、人工知能アシスタントを訓練するための報酬信号として使用されます。

グラフから分かるように、このアプローチは、他の言語モデルのトレーニングに使用される従来の「人間からのフィードバックに基づく強化学習（RLFH）」手法と比較して、より良い結果をもたらします。つまり、クロードは他のチャットボットよりも有害な発言をしたり、不適切な行動を取ったりする可能性が低いということです。

憲法上のRL vs 標準的なRLHF

唯一の人間による監視は、国連世界人権宣言やDeepMindのスパロー原則など、さまざまなソースから借用した規則や原則のリストを通じて提供されます。詳細はこちらをご覧ください。 https://www.anthropic.com/news/claudes-constitution

Claudeの特徴と最新モデル

一般的に、人工知能システムは、コーディング能力、数学問題への解答能力、その他のタスクの遂行能力を判断するための標準化テストであるベンチマーク評価でのパフォーマンスに基づいて評価されます。この評価基準によると、Claudeの最新バージョンは、OpenAIやGoogleの最も強力なモデルとほぼ同等の能力を有しています。

ベンチマークにおけるClaude 3.5と他のモデルとの比較

しかし、Claudeの最大の特長である感情的知性は、簡単に測定できるものではありません。人々は、クロードはただ感じ方が違うだけだと言います。より創造的で共感力があり、洞察力に優れ、ロボットのような嫌味がありません。クロードのアウトプットは、賢く、気配りのできる人間が返すような反応であり、他のチャットボットが生成するありきたりの文章とは異なります。

開発者は、このチャットボットの以下の優れた点を強調しています。

Claudeは、AWSとGCPによるアクセス性、SOC 2 Type II認証、HIPAA準拠オプションを提供しており、厳格なセキュリティ慣行に従っているため、安全です。
Claudeは、最高クラスの脱獄耐性と誤用防止を兼ね備えているため、信頼性があります。
Claudeは、長文の文書でも誤認識率が非常に低く、精度が非常に高いため、信頼性があります。

現在のClaudeモデルの比較：

モデル	Claude 3.5 Sonnet	Claude 3.5 Haiku	Claude 3 Opus	Claude 3 Sonnet	Claude 3 Haiku
説明	最もインテリジェントなモデル	最速モデル	非常に複雑なタスクに最適な強力なモデル	知性とスピードのバランス	最も高速でコンパクトなモデルで、ほぼ瞬時のレスポンスを実現
長所	最高レベルの知性と能力	圧倒的なスピードで情報を処理	最高レベルの知性、流暢性、理解力	スケーラブルな展開に最適な強力なユーティリティ	迅速かつ正確なターゲットパフォーマンス
多言語	はい	はい	はい	はい	はい
ビジョン	はい	いいえ	はい	はい	はい
比較レイテンシ	速い	最速	中程度の速さ	速い	最速
コンテクストウィンドウ	20万トークン	20万トークン	20万トークン	20万トークン	20万トークン
最大出力	8192トークン	8192トークン	4096トークン	4096トークン	4096トークン
トレーニングデータ締切	2024年4月	2024年7月	2023年8月	2023年8月	2023年8月

20万トークンは、およそ15万の英語の単語または68万のユニコード文字に相当します。

8192トークンは、おおよそ6200の英単語または12～14ページ（シングルスペース）に相当します。

4096トークンは、おおよそ3100の英単語または6～7ページ（シングルスペース）に相当します。

最新モデルの2つは、Claude 3.5 SonnetとClaude 3.5 Haikuと呼ばれています。

Claude 3.5 Sonnet は最もパワフルでインテリジェントなモデルです。微妙なニュアンスを含む指示や文脈を理解し、自身のミスを認識して修正し、チャートやグラフ、複雑なダイアグラムなどのビジュアルから情報を抽出することができます。推論能力の向上、大きな文脈ウィンドウ、低レベルの幻覚、そして何よりも温かみのある人間らしいトーンにより、Claude 3.5 Sonnet は質問への回答、文書や知識ベースの分析に理想的なチャットボットとなっています。

Claude 3.5 Haiku は最速のモデルです。顧客サービス、ソーシャルプラットフォーム、オンラインコミュニティ、eコマース、教育など、迅速な応答が求められるあらゆる場面で真価を発揮します。Claude 3.5 Haiku は、開発を迅速化する高速かつ正確なコード提案を提供します。コーディングを簡素化し、生産性を向上させたいソフトウェア開発チームに最適です。Claude 3.5 Haiku はテキスト入力のみをサポートしており、視覚データの処理はできません。

Claudeにできること：長所と短所

あらゆるタスクに最適なサイズのClaudeシリーズは、スピードとパフォーマンスの最高の組み合わせを提供します。Claudeは複雑な認知タスクとルーチンデータ処理を同様に容易に実行できます。高度な言語理解から高速な数値計算まで、Claudeモデルは、幅広い業務および個人的なニーズに対応する頼れるアシスタントです。

手書きのメモやグラフから写真まで、静的画像の転記と分析
リアルタイムでさまざまな言語間の翻訳、文法の練習、多言語コンテンツの作成。
HTMLとCSSによるウェブサイトの作成、画像の構造化JSONデータへの変換、複雑なコードベースのデバッグ。
自然な会話を行い、詳細でわかりやすい回答を提供。
Claudeはコンテクストウィンドウが非常に大きいため、書籍全体を分析したり、長いエッセイを批評したりするなど、より大きなデータを処理することができます。

サポートされている文書タイプ：

PDF
DOCX
CSV
TXT
HTML
ODT
RTF
EPUB
JSON

ファイル容量制限：

1ファイルあたり30MB
1チャットにつき最大5ファイル

技術的な制限：クロードはインターネットで情報を検索したり、画像を作成したり、音声モードを使用したりすることはできません。

クロードはジョーク、ダジャレ、謝罪、お世辞を理解します。チャットボットの優れた文章作成能力により、感情的で人間らしいストーリーを紡ぎ出すことができます。

しかし、一部の人々はチャットボットの文章が以前よりも悪くなったと不満を訴えています。その理由は、クロードの性格にあります。

人工知能モデルを開発する企業は、一般的に有害な発言を避け、有害な作業を支援しないようにモデルを訓練します。その目的は、モデルが「無害」な行動を取るように訓練することです。しかし、私たちが心から賞賛する人物の性格について考えるとき、私たちは単に有害な行動を避けることだけを考えているわけではありません。私たちは、世界に対して好奇心を持ち、他人に不親切になることなく真実を伝えようと努力し、自信過剰や過剰な警戒心に陥ることなく物事のさまざまな側面を捉えることができる人々について考えます。私たちは、忍耐強く人の話を聞く人、慎重に考える人、機知に富んだ会話をする人、そして賢明でバランスのとれた人間であると私たちが考えるその他の多くの特性について考えます。

時には、クロードは臆病な態度を取り、デリケートな質問には一切答えようとしません。開発者たちは、このボットから違法な情報を引き出すのは難しいと自負しています。例えば、お金の偽造方法や警察から逃れる方法などです。しかし、クロードは時折、自己検閲を行い、まったく無害なリクエストに対して講義を始めます。例えば、クビになったことについて面白い話を書くことをボットは拒否します。「不適切なユーモアで誰かの気分を害したくない」からです。あるいは、有名なキャラクターのパロディを依頼された場合、著作権侵害を指摘することもあります。

Redditユーザーはクロードをからかいます。

私：こんにちは、Claude：謝り始める

しかし、この感度の良さには良い面もあります。Anthropicはお客様のプライバシーをしっかりと保護します。

Anthropicは、お客様のデータを使ってモデルのトレーニングを行いません。また、お客様のデータはすべて30日後に自動的に削除され、チャットの履歴はいつでもサーバーから削除することができます。

Claudeの活用例

Claudeは、契約書や訴訟記録など、長文の法律文書を徹底的に調査し、内容を理解することができます。この時間のかかる作業を代行することで、Claudeは弁護士がより高度な業務に貴重な時間を費やせるようサポートします。これが、法律関連のテクノロジーを開発するスタートアップ企業Robin AIが、法律文書の分析にClaudeを採用している理由です。

Scribd, Inc.は、Claudeを使用して、何百万ものユーザーアップロード文書に対して高品質なメタデータを生成し、コンテンツの発見性を向上させ、グローバルプラットフォーム全体でユーザーエンゲージメントを促進しています。

高品質なメタデータが欠如していたユーザーアップロードコンテンツの70%に対応。
より詳細なコンテンツ説明により、ユーザー登録と購読が大幅に増加。
1億件以上の文書を処理する規模に拡張。

モダンな保険プラットフォームであるNewfrontは、Claudeを使用して煩雑な保険業務を自動化し、即時サポートを提供することで、誰もが保険をより利用しやすく効率的なものにしています。

Claudeにより、Newfrontは

人事チームの作業を年間1か月分削減し、従業員に24時間365日体制のパーソナライズされたサポートを提供しています。
文書処理コストを60%削減しています。
法務チームに即時の契約審査を提供しています。

Zapiaは、WhatsAppなどの人気のメッセージングアプリを通じて、ラテンアメリカの消費者が商品を発見し、購入し、サポートを受けられるように支援しています。

Claudeの導入により、Zapiaは

最初の1年で250万人のユーザーを獲得しました。
90%以上のユーザーからポジティブなフィードバックを得ました。
1時間あたり数十万ものメッセージを処理しています。

ご覧の通り、クロードの汎用性は、その商業的可能性を際立たせています。企業は、営業からソフトウェア開発までのワークフローにクロードを導入しています。反復的な作業を自動化し、コンテンツ作成を支援することで、クロードは生産性を向上させ、人間の労働者をより価値の高い業務に集中させることができます。

クロードの顧客と商業利用例について、さらに詳しくはこちらをご覧ください。 https://www.anthropic.com/customers

100万件のランダムに抽出されたチャットに基づく統計：

10.4% – ウェブおよびモバイルアプリ開発
9.2% – コンテンツ作成およびコミュニケーション
7.2% – 学術研究および執筆
7.1% – 教育およびキャリア開発
6.0% – 高度な人工知能/機械学習アプリケーション
5.7% – ビジネス戦略および業務
4.5% – 言語翻訳
3.9% – DevOpsおよびクラウドインフラ
3.7% – デジタルマーケティングおよびSEO
3.5% – データ分析および可視化

このデータは、人工知能の利用パターンを概観し、個人のプライバシーを侵害することなくトレンドや行動を明らかにするプラットフォーム、Clio（Claude Insights and Observations）によって収集されたものです。

さまざまなカテゴリーにわたる幅広いアプリケーションと高い利用率は、人工知能を搭載したソリューションがますます一般的になっていることを示しています。このトレンドは、Claudeのようなツールの多用途性を示しており、人工知能が私たちの仕事や生活にますます統合されてきていることを反映しています。