Yerli Yapay Zeka Modeli Açık Kaynak Olarak Yayımlandı — Türkçe Dil Optimizasyonu Öne Çıkıyor

Sanayi ve Teknoloji Bakanlığı ile T3 Vakfı'nın koordinasyonunda geliştirilen yerli büyük dil modeli açık kaynak olarak yayımlandı. Türkçe dil optimizasyonu ve yerel veri eğitimi öne çıkıyor.

Sanayi ve Teknoloji Bakanlığı ile T3 Vakfı'nın koordinasyonunda geliştirilen yerli büyük dil modeli (LLM), açık kaynak olarak yayımlandı. Türkçe dil optimizasyonu ve yerel veri eğitimi modeli farklılaştıran temel özellikler arasında öne çıkıyor. Modelin yazılım geliştiriciler için Hugging Face üzerinden ücretsiz olarak indirilebilir hale geldiği duyuruldu.

Model, Türkiye'nin ulusal yapay zeka stratejisinin uygulanması kapsamında geliştirildi. Cumhurbaşkanlığı Dijital Dönüşüm Ofisi'nin koordinasyonunda hazırlanan 2026 sonrası strateji belgesi, yerli büyük dil modeli yatırımını öncelikli alanlar arasında konumlandırmıştı. T3 Vakfı'nın teknik altyapısı ve Sanayi ve Teknoloji Bakanlığı'nın finansman desteği ile yürütülen proje, 18 aylık bir geliştirme sürecinin ardından kamuoyuyla paylaşıldı.

Modelin teknik özellikleri açısından öne çıkan noktalar: 70 milyar parametreli bir mimariye sahip olması, eğitim verisinin %65'inin Türkçe kaynaklardan oluşması ve KVKK uyumlu veri toplama süreçleri ile geliştirilmiş olması. Eğitim verisi; Türk Dil Kurumu'nun açık metin kaynakları, Resmi Gazete arşivi, açık erişimli bilimsel makaleler, Türkçe gazete arşivleri (telif izinli) ve teknik dokümantasyondan derlendi.

Uygulama alanları geniş bir yelpazeyi kapsıyor. Kamu hizmetlerinin dijital dönüşümünde, eğitim sektöründe öğrenci-öğretmen etkileşim platformlarında, sağlık alanında klinik karar destek sistemlerinde ve hukuk alanında belge analizinde modelin uygulanması öngörülüyor. Model, özellikle Türkçe metin üretimi, çeviri, özetleme ve soru-cevap görevlerinde küresel emsallerine göre belirgin biçimde daha iyi performans gösteriyor.

Açık kaynak olarak yayımlanması, Türkiye'nin yerli teknoloji ekosistemini destekleyici bir yaklaşım. Geliştiriciler ve şirketler modeli kendi uygulamalarında kullanabiliyor; gerekli durumlarda ek eğitim (fine-tuning) yapabiliyor. Apache 2.0 lisansı ile yayımlanan model, hem akademik hem ticari kullanım için açık. Bu yaklaşım, Çin'in Qwen ve DeepSeek modelleri ile Meta'nın Llama serisinin benimsediği açık kaynak politikasıyla uyumlu.

Küresel karşılaştırma açısından, model OpenAI'nin GPT-4 ve Anthropic'in Claude modellerine kıyasla parametre büyüklüğü bakımından küçük olsa da Türkçe görevlerde rekabetçi sonuçlar veriyor. T3 Vakfı'nın paylaştığı performans değerlendirmesi raporuna göre Türkçe paragraf anlama, çıkarım yapma ve metin üretimi görevlerinde model küresel premium modellerle başa baş veya bazı görevlerde daha iyi sonuçlar veriyor. İngilizce görevlerde ise küresel modellerin gerisinde kalıyor; bu durum modelin Türkçe odaklı eğitim verisi seçimiyle bağlantılı.

Modelin işletme maliyeti açısından, geliştiriciler için tamamen ücretsiz. Cumhurbaşkanlığı Dijital Dönüşüm Ofisi ile T3 Vakfı'nın iş birliğiyle Türkiye'nin yerli bulut altyapısında modelin API hizmeti de sunulacak; bu hizmet kamu kurumları için ücretsiz, özel sektör için piyasa düzeyinin altında bir fiyat skalası ile sunulacak.

Eğitim kurumlarının modelden yararlanması için özel bir program duyuruldu. Üniversiteler, modeli kendi araştırma projelerinde ücretsiz olarak kullanabilecek; ek olarak akademisyenler için 'fine-tuning' eğitimi programı düzenlenecek. Akdeniz Üniversitesi başta olmak üzere Türkiye'nin önde gelen üniversiteleri, modelin akademik kullanımına yönelik pilot programlara katılacak.

Güvenlik tarafında, modelin etik kullanımı için bir 'sorumlu yapay zeka' çerçevesi oluşturuldu. Model, zarar verici içerik üretimini önleyen kontrol katmanlarına sahip; yanlış bilgi yayılımı, ırkçılık ve şiddet temalı içerik üretimi engelleniyor. Bu altyapı, AB'nin AI Act'i ve Çin'in yapay zeka düzenlemeleriyle uyumlu standartlar üzerine kuruldu.

Kaynak: Sanayi ve Teknoloji Bakanlığı ile T3 Vakfı yerli yapay zeka modeli açıklama duyurusu — sanayi.gov.tr ve t3vakfi.org

Yerli Yapay Zeka Modeli Açık Kaynak Olarak Yayımlandı — Türkçe Dil Optimizasyonu Öne Çıkıyor

Yorumlar…