Grok: Elon Musk'ın “Maksimum Gerçeği Arayan” Sohbet Robotu

Grok, Elon Musk tarafından kurulan araştırma şirketi xAI tarafından geliştirilen üretken bir yapay zeka sohbet robotudur. Diğer popüler sohbet robotları gibi Grok da metin veya kod üretebilir, verileri analiz edebilir ve karmaşık sorunları çözebilir. Ancak Grok'u diğerlerinden ayıran özelliği mizah anlayışı ve alışılmışın dışında düşünme yeteneğidir. Bu makalede, sohbet robotunun tarihçesini, yeteneklerini ve öne çıkan özelliklerini inceleyeceğiz.

Grok'un tarihi

Elon Musk, 2015 yılında OpenAI'yi (ChatGPT ile tanınan) kurdu, ancak 3 yıl sonra “OpenAI ekibinin yapmak istediği bazı şeylere katılmadığı” için şirketten ayrıldı.

Nisan 2023'te Elon Musk bir röportajda ChatGPT'nin politik olarak fazla doğrucu olduğunu, kendisinin ise “evrenin doğasını anlamaya çalışan, maksimum gerçeği arayan bir yapay zeka” yaratmak istediğini söyledi. Bu projenin geçici adı TruthGPT (İngilizce “truth” kelimesinden türetilmiştir) idi.

Elon Musk, TruthGPT'yi tanıtıyor

Sonunda adı Grok olarak değiştirildi. Bu isim, Robert A. Heinlein'ın 1961 tarihli bilim kurgu romanı “Stranger in a Strange Land”den esinlenerek verildi. Romanda “grok” terimi, bir şeyi derinlemesine ve sezgisel olarak anlamak anlamına geliyor.

Grok'un ilk sürümü Kasım 2023'te yayınlandı.
Mart 2024'te, öncü mantık yetenekleri ve 128.000 tokenlik daha büyük bir bağlam penceresi ile Grok-1.5'e yükseltildi.
Aralık 2024'te Grok-2 piyasaya sürüldü. Bu model hem metinleri hem de görüntüleri işleyebiliyordu.
Son olarak, Şubat 2025'te Grok 3 piyasaya sürüldü. Elon Musk bu modeli “korkutucu derecede akıllı” olarak nitelendirdi.

Bu yeni sürüm, önceki en gelişmiş modellerin 10 katı hesaplama gücüne sahip Colossus süper bilgisayarda eğitildi.

Grok'un performansı

Elon Musk, Grok 3'ün dünyadaki en akıllı yapay zeka olduğunu söylüyor. Gerçekten reklamı kadar iyi mi? Bir bakalım:

Grok 3, endüstri standardı NLP ve yapay zeka benchmarkları ile doğrulanmış, önceki modele göre %20 daha yüksek doğruluk oranı sergiliyor.
ChatGPT o1 pro ve DeepSeek R1 ile karşılaştırıldığında %25 daha hızlı işlem hızı ve doğal dil anlama ve yanıt üretmede %15 daha yüksek doğruluk.
Matematik, bilim ve kodlama benchmarklarında etkileyici sonuçlar.

Matematik, fen bilimleri, kodlama

Daha fazla karşılaştırma:

matematik, doğa bilimleri, kodlama, çoklu modlu anlama

Yukarıdaki resimlerde de görebileceğimiz gibi, Grok 3 aşağıdaki alanlarda son derece başarılıdır:

matematik (AIME'25 ve AIME'24)
biyoloji, fizik ve kimya gibi doğa bilimleri (GPQA)
kodlama (LCB)
çok modlu anlama (MMMU)

MMMU benchmark'ı tek başına, Sanat ve Tasarım, İşletme, Sağlık ve Tıp, Bilim, Beşeri Bilimler ve Sosyal Bilimler ile Teknoloji ve Mühendislik gibi disiplinleri kapsayan 11.500 sorudan oluşmaktadır.

MMMU örneği

Grok-3'ün ilk versiyonu (kod adı “Chocolate”), LMSYS Arena'da (rekabetçi bir ortamda farklı büyük dil modellerini değerlendirmek ve karşılaştırmak için tasarlanmış bir platform) 1 numaralı pozisyonu elde ederek, tüm kategorilerde 1400 puanı aşan ilk yapay zeka modeli oldu.

Grok'un mevcut modelleri

Grok 3, farklı şekil ve boyutlarda mevcuttur. Amiral gemisi modeli, basitçe Grok 3 olarak adlandırılmıştır. Finans, sağlık, hukuk ve bilim alanlarında derin alan bilgisine sahiptir. Hafif bir model ise Grok 3 mini olarak adlandırılmıştır. Hızlı, akıllı ve derin alan bilgisi gerektirmeyen mantık tabanlı görevler için idealdir.

Ayrıca, aynı temel modeli kullanan ve aynı yanıt kalitesini sunan hızlı varyantlar (grok-3-fast-beta ve grok-3-mini-beta) da mevcuttur, ancak bunlar daha hızlı bir altyapı üzerinde sunulur ve bu sayede yanıt süreleri önemli ölçüde kısalır.

Teknik özellikler
İşlem hızı	1,5 petaflop
Parametreler	2,7 trilyon
Eğitim jetonları	12,8 trilyon
Yanıt gecikmesi	67 milisaniye (ortalama)
Bağlam penceresi	131072 token

Grok, görüntüleri analiz edebilir (resimleri tanımlayabilir, nesneleri tanımlayabilir, metinleri okuyabilir):

Maksimum görüntü boyutu: 10 MiB
Maksimum görüntü sayısı: Sınırsız
Desteklenen görüntü dosya türleri: jpg, jpeg, png
Herhangi bir görüntü/metin giriş sırası kabul edilir

Ayrıca Grok, Aurora kod adlı otoregresif görüntü oluşturma modelini kullanarak yüksek kaliteli görüntüler oluşturabilir. Bu model, multimodal girişi yerel olarak destekler, böylece kullanıcılar tarafından sağlanan resimlerden ilham alabilir veya bunları doğrudan düzenleyebilir. Aurora'nın X platformunda mevcut olduğunu, ancak diğer platformlarda mutlaka mevcut olmayabileceğini lütfen unutmayın.

Resmi API'daki Grok modelleri internete bağlı değildir, yani 17 Kasım 2024'ten sonraki dünya olayları hakkında hiçbir bilgileri yoktur.

Grok'un eğitimi

Grok 3'ün geliştirilmesi, 200.000 Nvidia H100 ve H200 GPU'da çalışan xAI'nin Colossus süper bilgisayarı tarafından hızlandırıldı. Yeni model, Grok-2'nin 10 katından fazla olan 200 milyon GPU saatlik eğitim aldı. Bu muazzam hesaplama gücü artışı sayesinde Grok 3, benzeri görülmemiş bir verimlilikle devasa veri kümelerini işleyebilir ve daha da yüksek doğruluk elde edebilir.

Geliştiriciler, Grok 3'ün performansını artırmak için sentetik veri kümeleri, otomatik düzeltme mekanizmaları ve pekiştirmeli öğrenmeyi içeren bir eğitim yaklaşımı benimsedi:

Sentetik veri kümeleri. Bunlar, hassas veya özel bilgiler kullanılmadan gerçek dünyadaki verileri taklit etmek için yapay olarak oluşturulan verilerdir. Çeşitli senaryoları simüle ederek dil modellerini eğitmek için kullanılırlar ve öğrenme verimliliğini artıran ve veri gizliliği endişelerini gideren, çeşitli ve kontrollü bir veri kümesi sağlarlar.
Öz düzeltme mekanizmaları. Grok-3, zaman içinde kendi cevaplarını doğrulama ve iyileştirme özelliğine sahiptir. Sistem, cevaplarını güvenilir kaynaklarla karşılaştırır, hatalı yerleri tespit eder ve bir dahaki sefere yaklaşımını değiştirir. Bu sürekli kendini geliştirme özelliği, sistemi ne kadar çok kullanırsanız o kadar az hata yapacağı ve cevaplarında insan benzeri doğruluğa kademeli olarak yaklaşacağı anlamına gelir. Kusursuz değildir, ancak her etkileşimden öğrenecek şekilde tasarlanmıştır.
Pekiştirme öğrenimi. Bir tür makine öğrenimi olup, yapay zeka modeli, tıpkı insanların deneyim yoluyla beceriler edindiği gibi, eylemleri için ödül veya ceza alarak öğrenir. Sistem, deneme yanılma yoluyla olumlu sonuçları en üst düzeye çıkarmak ve karar verme yeteneklerini geliştirmek için eğitilir.

Bu teknikler, birden fazla doğrulama adımı kullanarak halüsinasyon olarak bilinen yanlış yanıtları azaltmaya ve sürekli öz değerlendirme ve öğrenme yoluyla daha etkili bir şekilde uyum sağlamaya yardımcı olur.

Grok'un yanıtlarını daha doğal ve alakalı hale getirmek için, geliştiriciler insan geri bildirim döngüleri (insanların yapay olarak üretilen içeriğin doğruluğunu, alakalılığını ve yararlılığını değerlendirdiği bir eğitim yöntemi) ve bağlamsal eğitim (bota daha doğru ve alakalı yanıtlar üretmesi için önceki etkileşimleri, kullanıcı niyetini ve çevresindeki bilgileri dikkate almayı öğretir) uygulamıştır.

Grok'un benzersiz özellikleri

Çoğu yapay zeka modeli resmi bir üslup kullanırken (ve genellikle robotik bir izlenim bırakırken), Grok 3 cesur ve ironik üslubuyla öne çıkıyor. Mizah, alay ve alışılmadık ifadeler kullanmaktan çekinmiyor. Grok, gerçeklere dayalı, önyargısız yanıtlara öncelik veriyor ve genellikle popüler anlatılara meydan okuyor. Diğer sinir ağları karmaşık konuları tartışmaktan kaçınırken, Grok farklı bir yaklaşım benimser. Felsefe, politika veya etik ikilemleri tartışmaktan çekinmez. Grok, birden fazla bakış açısını dikkate alabilir ve hatta emin olmadığında bunu itiraf edebilir; bu, sohbet robotları arasında nadir görülen bir dürüstlüktür. Bu, Grok'u genel bir cevap makinesi değil, bir sohbet ortağı gibi hissettirir.

Grok 3, çiftçiler, iş adamları, sürücüler ve içerik oluşturucular için yararlıdır

Grok, mümkün olan en yararlı ve doğru cevapları sunmak amacıyla geliştirilmiştir. Bot, karmaşık veya açık uçlu soruları yanıtlarken öne çıkmaktadır. Birçok chatbot hızlı bilgiler veya önceden yazılmış cevaplar konusunda başarılı olsa da, Grok özellikle bilim ve eleştirel düşünme gibi alanlarda nüanslı soruları yanıtlamak için tasarlanmıştır. Kuantum mekaniği veya etik ikilemler gibi karmaşık konuları basitleştirmeden anlaşılır açıklamalara dönüştürebilir. Bu, öğrenciler, araştırmacılar veya meraklı zihinler gibi yüzeysel cevapların ötesinde bilgi isteyen kullanıcılar için vazgeçilmez bir kaynak haline getirir.

Ayrıca, kullanıcılar bu botun ChatGPT veya Claude'dan çok daha az sansür uyguladığını belirtiyor. Bununla birlikte, Grok, bomba yapımı gibi zararlı veya yasa dışı talimatları önlemek için güvenlik protokollerine sahiptir. Eğer böyle bir soru sorarsanız, bot konuyu saptırır ve belki de patlayıcıların bilimini genel ve öğretici olmayan bir şekilde açıklar veya “Bir şeyleri havaya uçurmayalım; daha az yanıcı bir şey keşfetmeye ne dersiniz?” der. Bu, konuşmayı tamamen sonlandırabilen veya aşırı belirsiz yanıtlar veren bazı sohbet robotlarının aksine, açıklık ile sorumluluk arasında bir denge sağlar.

Grok'un geleceği

Elon Musk, bir canlı yayında Grok 3'ün yakında bir ses modu içereceğini ve kullanıcıların sesli komutlarla Grok sohbet robotuyla konuşup AI tarafından üretilen sesli yanıtlar alabileceğini belirtti. Grok 3'te ses modunun tanıtılmasıyla, kullanıcılar yapay zeka ile daha doğal ve etkileşimli bir şekilde iletişim kurarak insan ve makine iletişimi arasındaki sınırları bulanıklaştıracak.

DeepSearch, Think modu ve Big Brain modu gibi premium özellikler daha geniş bir kitleye sunulacak. DeepSearch, Grok'un arama motorudur. En son gerçek zamanlı haberlere erişmek, önemli bilgileri sentezlemek, çelişkili gerçekler ve görüşler hakkında akıl yürütmek ve karmaşıklıktan netlik çıkarmak için tasarlanmıştır. Think modu, kullanıcının komutuna bir düşünce zinciri yaklaşımı sunar. Çıktı, modelin akıl yürütmesinin adım adım ayrıntılarıdır. Matematik problemleri, felsefi sorular veya teknik açıklamalar gibi dikkatli mantık gerektiren karmaşık sorular için uygundur. Big Brain modu, daha geniş bir bağlam, gelişmiş örüntü tanıma veya daha büyük bir bilgi tabanından yararlanan daha kapsamlı, yaratıcı veya hesaplama açısından yoğun bir moddur. Çok yönlü veya açık uçlu soruları ele almak, yenilikçi fikirler üretmek veya farklı alanlar arasında bağlantılar kurmak için idealdir. Bu mod, daha yüksek bir soyutlama veya sezgi düzeyini simüle edebilir.

Donanım açısından, xAI'nin Colossus süper bilgisayarı dünyanın en büyük ve en güçlü yapay zeka eğitim sistemidir. Herkesin tahmininden daha hızlı, sadece 122 günde inşa edilen bu sistem, başlangıçta 100.000 Nvidia H100 GPU ile çalışıyordu.

İnşaat süresi – 122 gün

xAI, Nvidia'nın yeni ve daha güçlü Blackwell H200 yongalarını entegre ederek 92 gün gibi etkileyici bir sürede kapasitesini iki katına çıkararak 200.000 GPU'ya ulaştı. Bu muazzam güç artışı sadece başlangıç. xAI, Colossus'u 1 milyon yongaya çıkarmayı planlayarak, daha da güçlü ve çığır açıcı olacak gelecekteki Grok modellerinin önünü açıyor. Grok'un gelecekteki versiyonları video, ses ve gerçek zamanlı veri akışlarını işleyebilecek.

Bu teknolojiler geliştikçe, endüstrileri dönüştürme, öğrenmeyi geliştirme ve kolektif bilgimizi henüz anlamaya başladığımız şekillerde genişletme potansiyeline sahip olacaklar. Grok'un metin tabanlı bir sohbet robotundan çok modlu, gerçek zamanlı etkileşimli bir varlığa dönüşüm yolculuğu, yapay zeka inovasyonunun hızlı ilerleyişinin bir kanıtıdır ve kullanıcılar, geliştiriciler ve genel olarak teknoloji topluluğu için heyecan verici bir gelecek vaat etmektedir.

Grok 4'ün 2025 sonunda piyasaya sürülmesi bekleniyor.