Anthropic Kodlama ve Bilimde Vites Yükseltti

Anthropic’ten Yeni Yapay Zeka Hamlesi: Claude Fable 5 ve Mythos 5 Tanıtıldı

Fable 5 Kodlama ve Analitik Testlerde Zirveye Yerleşti

Yapay zeka şirketi Anthropic, Claude ailesinin beşinci nesline ait iki yeni modelini duyurdu. Şirket tarafından tanıtılan Claude Fable 5 ve Claude Mythos 5 modelleri aynı temel mimariyi paylaşsa da farklı kullanım alanlarına hitap ediyor. Genel kullanıcılar için geliştirilen Fable 5, güvenlik önlemleriyle desteklenirken, daha gelişmiş yeteneklere sahip Mythos 5 ise yalnızca belirli iş ortaklarının erişimine açıldı.

Anthropic’e göre Fable 5, şirketin şimdiye kadar yayımladığı tüm genel kullanıma açık modelleri geride bırakmayı başardı. Özellikle yazılım geliştirme alanında dikkat çeken model, gerçek GitHub projelerindeki mühendislik problemlerini çözmeyi ölçen SWE-Bench Pro testinde yüzde 80,3 başarı oranına ulaştı. Aynı testte Claude Opus 4.8 yüzde 69,2, GPT 5.5 yüzde 58,6 ve Gemini 3.1 Pro ise yüzde 54,2 seviyesinde kaldı. Şirket ayrıca Fable 5’in daha az token kullanarak daha yüksek performans sunduğunu belirtiyor.

Ödeme teknolojileri şirketi Stripe’ın açıklamasına göre Fable 5, normal şartlarda aylar sürecek bazı mühendislik çalışmalarını birkaç gün içerisinde tamamlayabildi. Şirket, 50 milyon satırlık bir Ruby kod tabanındaki büyük bir geçiş sürecinin model tarafından yalnızca bir günde tamamlandığını ve bunun normalde bir ekip için iki aydan fazla süreceğini ifade etti.

Görsel Analiz ve Bilimsel Verilerde Yeni Seviye

Anthropic, Fable 5’in yalnızca kodlama alanında değil, karmaşık analiz ve bilgi işleme görevlerinde de önemli ilerleme kaydettiğini açıkladı. Şirketin verilerine göre model, deneyimli finans analistlerinin muhakeme becerilerini ölçen Hebbia Finance Benchmark testinde en yüksek puanı aldı.

Görsel analiz alanında da dikkat çeken modelin ayrıntılı bilimsel çizimlerden veri çıkarabildiği, grafik ve tabloları yorumlayabildiği ve yalnızca ekran görüntülerini kullanarak bir web uygulamasının kaynak kodunu yeniden oluşturabildiği belirtildi. Anthropic ayrıca Fable 5’in yalnızca ekran görüntülerini kullanarak Pokemon FireRed oyununu oynayabildiğini ve önceki modellerin ihtiyaç duyduğu yardımcı araçlara gerek duymadığını açıkladı.

Şirket, modelin milyonlarca token boyunca dikkatini koruyabildiğini ve not alma yöntemiyle kendi performansını artırabildiğini belirtse de bu alandaki teknik test sonuçlarını henüz paylaşmadı.

Mythos 5 İlaç Tasarımı ve Genetik Araştırmalarda Öne Çıkıyor

Anthropic’in daha gelişmiş modeli olan Mythos 5, özellikle biyoteknoloji ve bilimsel araştırmalar alanında dikkat çekici sonuçlar ortaya koydu. Şirketin protein tasarımı uzmanları, modelin ilaç geliştirme süreçlerinin bazı bölümlerini yaklaşık 10 kat hızlandırabildiğini belirtiyor.

Anthropic’in paylaştığı testlerde Mythos 5, insan müdahalesi olmadan protein bağlanma noktalarını belirledi, tasarım araçlarını çalıştırdı, oluşan hataları düzeltti ve ilaç adayları geliştirdi. İncelenen 14 protein hedefinden 9’unda güçlü aday sonuçlar elde edildiği ve bu çalışmaların şu anda bilimsel inceleme sürecinde olduğu açıklandı.

Şirket ayrıca Mythos 5’in özgün ve ikna edici bilimsel hipotezler üretebilen ilk yapay zeka modeli olduğunu iddia ediyor. Kör değerlendirme testlerinde Anthropic araştırmacıları, modelin moleküler biyoloji alanındaki hipotezlerini önceki Opus serisi modellere kıyasla yaklaşık yüzde 80 oranında daha başarılı buldu. Üretilen hipotezlerden birinin bağımsız bir bilimsel çalışma tarafından da desteklendiği belirtildi.

Bir Haftadan Uzun Süren Otonom Genom Araştırması

Anthropic’in en dikkat çekici açıklamalarından biri ise Mythos 5’in genom araştırmalarında gösterdiği performans oldu. Şirket, modelin 138 farklı hayvan türüne ait milyonlarca hücreden oluşan tek hücreli genom verilerini bir haftadan uzun süre boyunca büyük ölçüde kendi başına analiz ettiğini açıkladı.

Bu süreçte model, farklı canlı türlerinde aynı işlevi gören hücreleri belirlemek amacıyla kendi makine öğrenmesi modelini geliştirdi ve eğitti. Anthropic’e göre ortaya çıkan sistem, yakın zamanda Science dergisinde yayımlanan benzer bir modelden daha başarılı sonuçlar üretirken yaklaşık 100 kat daha küçük boyutta çalıştı. Şirket, bu araştırmanın bilimsel sonuçlarını ilerleyen aylarda yayımlamayı planlıyor.

Siber Güvenlikte Yeni Dönem ve Tartışmalı Güvenlik Önlemleri

Anthropic, Mythos 5’in şu aşamada yalnızca ABD hükümetiyle ortak yürütülen Project Glasswing programı kapsamında kullanılacağını duyurdu. Şirket, modeli dünyanın en güçlü siber güvenlik yapay zekası olarak tanımlıyor. ExploitBench testinde yüzde 78 başarı oranına ulaşan Mythos 5, önceki Mythos Preview sürümünün yüzde 69 ve Opus 4.8’in yüzde 40 seviyesindeki performansını geride bıraktı.

Fable 5 ise olası kötüye kullanımları önlemek amacıyla yeni güvenlik mekanizmalarıyla birlikte sunuluyor. Sistem, siber saldırılar, biyoloji ve kimya alanındaki tehlikeli talepler veya model yeteneklerini kopyalamaya yönelik girişimler tespit ettiğinde otomatik olarak daha sınırlı yeteneklere sahip Claude Opus 4.8 modeline yönlendirme yapıyor. Anthropic, kullanıcıların yüzde 95’inden fazlasının bu güvenlik önlemlerinden etkilenmeyeceğini belirtiyor.

Yeni modellerin fiyatlandırması da dikkat çekti. Hem Fable 5 hem de Mythos 5 için giriş tokeni başına 10 dolar, çıkış tokeni başına ise 50 dolar ücret belirlendi. Bu rakamlar önceki Opus modellerine göre önemli ölçüde daha yüksek seviyede bulunuyor. Fable 5 şu anda API üzerinden erişime açılırken, abonelik kullanıcıları için kademeli dağıtım süreci uygulanıyor. Şirket, ilerleyen dönemde kapasite artırıldığında modeli yeniden standart abonelik paketlerine dahil etmeyi planlıyor.