DÜNYAYI SARSAN YAPAY Zekâ ARCI DEEP SEEK HAKKINDA BİLGİLER

Az sayıda çip ve az maliyetle geliştirilen modellerin sonuncusu DeepSeek-R1, OpenAI, Google ve Meta gibi dev oyuncuların sektördeki hakimiyetine meydan okuyor.

Çinli yapay zekâ laboratuvarı DeepSeek’in kendi adını taşıyan büyük dil modeli (LLM), ABD’li OpenAI firmasının ChatGPT’sinin en büyük rakiplerinden biri haline gelirken, Silikon Vadisi’ni şaşkınlığa uğrattı.

Bu ay yayınlanan son DeepSeek modellerinin hem son derece hızlı hem de az maliyetle geliştirildiği söyleniyor.

Aynı zamanda daha az sayıda çiple geliştirilen modellerin sonuncusu DeepSeek-R1, OpenAI, Google ve Meta gibi dev oyuncuların sektördeki hakimiyetine meydan okuyor.

İşte sekiz soruda DeepSeek:

1. Nereden çıktı bu DeepSeek?

Çin’in Hangzhou kentindeki şirket, Temmuz 2023’te Zhejiang Üniversitesi mezunu, bilgi ve elektronik mühendisi Liang Wenfeng tarafından kuruldu. Liang’ın 2015’te kurduğu bir fon olan High-Flyer’ın kuluçka programında yer aldı. Liang da sektörün diğer ileri gelen isimleri gibi, çeşitli görevlerde insanlara yetişebilen veya onları geçebilen “yapay genel zekâ” seviyesine ulaşmayı hedefliyor.

Bağımsız faaliyet gösteren DeepSeek’in finansman modeli, dış yatırımcıların baskısı olmadan iddialı yapay zekâ projelerini sürdürmesine ve uzun vadeli araştırma ve geliştirmeye öncelik vermesine olanak tanıyor. DeepSeek ekibi, Çin’in en iyi üniversitelerinden mezun genç ve yetenekli kişilerden oluşuyor ve yenilikçilik kültürünü teşvik ediyor. Şirketin işe alım sürecinde iş deneyiminden çok teknik becerilere öncelik veriliyor. Kısacası yapay zekâ modelleri geliştirme sürecinde yeni bir bakış açısına sahip olduğu düşünülüyor.

DeepSeek’in yolculuğu, Kasım 2023’te kodlama görevleri için tasarlanmış açık kaynaklı bir model olan DeepSeek Coder’ın piyasaya sürülmesiyle başladı. Bunu, diğer büyük dil modelleriyle rekabet etmeyi amaçlayan DeepSeek LLM izledi. Mayıs 2024’te piyasaya sürülen DeepSeek-V2, güçlü performansı ve düşük maliyeti nedeniyle ilgi gördü. ByteDance, Tencent, Baidu ve Alibaba gibi diğer büyük Çinli teknoloji devlerini de yapay zekâ modellerinin fiyatlarını düşürmeye zorladı.

2. DeepSeek modellerinin kapasitesi ne durumda?

DeepSeek-V2, daha sonra 236 milyar parametreye sahip daha gelişmiş bir model olan DeepSeek-Coder-V2 ile değiştirildi. Karmaşık kodlama istemleri için tasarlanan model 128.000 token’a varan yüksek bir bağlam penceresine sahip. 128.000 token’lık bağlam penceresi, modelin aynı anda işleyebileceği maksimum giriş metni uzunluğunu ifade ediyor.

Daha geniş bir bağlam penceresi, bir modelin daha uzun metinleri anlamasına, özetlemesine veya analiz etmesine olanak tanır. Bu, örneğin uzun belgeler, kitaplar veya karmaşık diyaloglar üzerinde çalışırken büyük bir avantaj sağlar.

Token ise metindeki bir birim anlamına geliyor. Bu birim genellikle kelime, kelime parçacığı (örneğin “yapay” ve “zekâ” gibi) veya hatta bir karakter olabilir. Örneğin: “Yapay zekâ harika!” cümlesi dört tokendan oluşabilir: “Yapay,” “zekâ,” “harika,” “!”.

Şirketin en son modelleri DeepSeek-V3 ve DeepSeek-R1 ise konumunu daha da sağlamlaştırdı. 671.000 parametreli bir model olan DeepSeek-V3, akranlarından önemli ölçüde daha az kaynak gerektirirken diğer markalarla çeşitli kıyaslama testlerinde etkileyici bir performans sergiliyor. Ocak 2025’te piyasaya sürülen DeepSeek-R1 de akıl yürütme, kodlama ve matematik gibi karmaşık görevlere odaklanıyor. Bu alandaki yetenekleriyle ChatGPT’nin son modellerinden biri olan o1’e meydan okuyor.

DeepSeek kısa sürede önemli bir başarı yakalamış olsa da Forbes, şirketin öncelikli olarak araştırmaya odaklandığını ve yakın gelecekte ticarileştirmeye yönelik detaylı planları olmadığını yazdı.

3. Son kullanıcı için ücretsiz mi?

DeepSeek’in ilgi çekmeyi başarmasının temel nedenlerinden biri son kullanıcılar için ücretsiz olması. Hatta bu, kullanıcılara ücretsiz olarak sunulan bu denli gelişmiş ilk yapay zekâ sistemi. OpenAI o1 ve Claude Sonnet gibi diğer güçlü sistemler ücretli abonelik gerektiriyor. Hatta bazı aboneliklerde bile kullanıcılara kota konuyor.

Google Gemini da ücretsiz olarak sunuluyor, ancak ücretsiz sürümleri eski modellerle sınırlı. DeepSeek’in şimdilik herhangi bir sınırlaması yok.

4. Nasıl kullanılır?

Kullanıcılar, son kullanıcı için geliştirilen DeepSeek sohbet arayüzüne “chat. Deepseek” adresinden erişebiliyor. Buradaki Chat ekranına komutları girmek ve internette arama yapmak için “search” butonuna basmak yeterli oluyor.

Herhangi bir konuyla ilgili daha ayrıntılı bilgiler elde etmek içinse “deep think” seçeneği var. Bu seçenek kullanıcıların istemlerine daha detaylı yanıtlar sunarken, arama motorunda da daha fazla sitede arama yapabiliyor. Ancak sadece belirli kaynaklara güvenerek arama yapan ChatGPT’nin aksine bu özellik, bazı ufak sitelerdeki yanlış bilgileri de kullanıcıların karşısına çıkarabilir. Bu yüzden kullanıcıların bu sohbet botunda da elde ettikleri bilgileri teyit etmesi gerek.

5. Güvenli mi?

DeepSeek kullanımıyla ilgili bir önemli soru başlığı da güvenli olup olmadığı. DeepSeek de tıpkı diğer hizmetlerde olduğu gibi kullanıcının verilerini istiyor ve bunlar muhtemelen Çin’deki sunucularda saklanıyor.

Kullanıcıların herhangi bir LLM’de olduğu gibi burada da sohbet botuna hassas verilerini vermemesi önemli.

DeepSeek de açık kaynaklı olduğu için bağımsız araştırmacılar modelin kodlarına bakıp güvenli olup olmadığını belirlemeye yönelik çalışmalar yapabilir. Güvenlik konusundaki endişelere yönelik daha ayrıntılı bilgilerin ilerleyen günlerde çıkması bekleniyor.

6. Açık kaynak kodlu olması ne anlama geliyor?

DeepSeek-R1 dahil olmak üzere modeller, büyük ölçüde açık kaynaklı olarak yayınlandı. Yani isteyen herkes aracın kodlarına erişebiliyor ve bu kodları kullanarak LLM’i kişiselleştirebiliyor. Eğitim verileri ise patentli.

Öte yandan OpenAI, o1 modelini kapalı olarak piyasaya sürmüştü ve halihazırda sadece kullanıcılara bile aylık 20 ila 200 dolarlık paketlerle satıyor.

7. ABD kısıtlamalarına rağmen nasıl böyle bir model üretti?

Şirket teknolojik yeteneklerini ve pazar erişimini geliştirmek için stratejik ortaklıklar da kurdu. Dikkat çeken iş birliklerinden biri, ABD’li çip firması AMD ile yapıldı. Forbes’a göre DeepSeek, özellikle DeepSeek-V3 için model geliştirmenin temel aşamalarında AMD Instinct GPU’larını (grafik işlem birimleri) ve ROCM yazılımını kullandı.

MIT Technology Review dergisi ise ABD’den Çin’e yönelik çip yaptırımlarının gelmesinden çok önce Liang’ın, şu anda Çin’e ihracatı yasaklanmış bir tür olan Nvidia A100 çiplerinden önemli miktarda stok satın aldığını yazdı. Çinli medya kuruluşu 36Kr, şirketin stoklarında 10.000’den fazla birim olduğunu tahmin ediyor. Bazıları bu rakamın 50.000 olduğunu söylüyor. Bu stokun yapay zekâ eğitimi açısından önemini fark eden Liang, DeepSeek’i kurdu ve modellerini geliştirmek için bunları düşük güçteki çiplerle birlikte kullanmaya başladı.

Ancak burada önemli olan bir nokta da Liang’ın az sayıda kaynakla yetkin modeller inşa etmenin yolunu bulmuş olması. ABD’nin çip ihracat kısıtlamaları, DeepSeek geliştiricilerini hesaplama gücü eksikliklerini telafi etmek için daha akıllı, daha enerji verimli algoritmalar oluşturmaya zorladı. ChatGPT’nin eğitim verilerini işlemek için 10.000 Nvidia GPU’ya ihtiyaç duyduğu düşünülüyor. DeepSeek mühendisleri sadece 2.000 GPU ile benzer sonuçlara ulaştıklarını söylüyor.

8. DeepSeek’in yenilikçi teknikleri neler?

DeepSeek’in başarısı birkaç önemli yeniliğe bağlanabilir.

Pekiştirmeli öğrenme: Teknolojist Janakiram MSV’ye göre, büyük ölçüde gözetimli ince ayara dayanan geleneksel yöntemlerin aksine, DeepSeek saf RL kullanıyor. Gözetimli ince ayar yönteminde ince ayar yapılmadan önce, model genellikle geniş bir veri kümesi üzerinde eğitilmiştir. Saf RL kullanmak ise bir yapay zekâ sisteminin yalnızca pekiştirmeli öğrenme yöntemlerini kullanarak eğitilmesi anlamına gelir. Bu, modelin insan tarafından ayıklanmış veriler veya gözetimli öğrenme yöntemleri olmaksızın, yalnızca ödül ve ceza mekanizmaları üzerinden öğrenmesi demek. Bu yaklaşım, DeepSeek-R1’in muhakeme yeteneklerini geliştirmede özellikle etkili.

MoE mimarisi: Açılımıyla Mixture of Experts, yani Uzmanlar Karışımı mimarisi yapay zekâ modellerinde farklı uzmanlardan oluşan yenilikçi bir sistem. Burada kullanıcının girdisi için en uygun birkaç uzman seçiliyor ve sadece onlar çalışıyor. Bu sayede hem büyük modellerin performansı artırılıyor hem de işlem maliyeti düşürülüyor. Bunu her biri farklı bir alanda uzmanlaşmış bir uzman ekibi olarak düşünmek mümkün. Bir görevle karşı karşıya kaldığında, yalnızca ilgili uzmanlar çağrılıyor ve kaynakların ve uzmanlığın verimli kullanımı sağlanıyor.

Multi-Head Latent Attention: Bu yöntem, bir modelin farklı dikkat başlıklarını kullanarak gizli temsiller ile girişler arasındaki ilişkileri öğrenmesini sağlıyor. Bilgiyi daha esnek, güçlü ve ayrıntılı şekilde işlemek için kullanılıyor. Bunu, girdi verilerinin farklı bölümlerine odaklanabilen ve modelin bilgiyi daha kapsamlı şekilde anlamasını sağlayan birden fazla “dikkatli kafa” olarak düşünmek mümkün.

Damıtma: DeepSeek, daha büyük modellerin bilgi ve yeteneklerini daha küçük, daha verimli olanlara aktarmak için damıtma tekniklerini kullanıyor. Bu, bir öğretmenin bilgisini bir öğrenciye aktarmasına benziyor. Öğrencinin benzer yeterlilikteki görevleri ancak daha az deneyim veya kaynakla gerçekleştirmesine olanak tanıyor. DeepSeek’in damıtma süreci, daha küçük modellerin daha büyük muadillerinin gelişmiş akıl yürütme ve dil işleme yeteneklerini devralmasını sağlayarak onları daha çok yönlü ve erişilebilir hale getiriyor.

Kısacası DeepSeek, RL ve MoE gibi verimli mimarileri kullanarak eğitim için gereken hesaplama kaynaklarını önemli ölçüde azaltıyor ve daha düşük maliyetlerle tamamlayabiliyor. Örneğin DeepSeek-V3, Meta’daki modellerin maliyetinin çok daha az bir kısmıyla eğitildi.

OpenAI ve Google gibi önemli oyuncuların yapay zekâ modellerine eğitim verileri sağlayan ScaleAI firmasının CEO’su Alexandr Wang, perşembe günü İsviçre’nin Davos kentinde düzenlenen Dünya Ekonomik Forumu’nda (WEF) yaptığı konuşmada DeepSeek’in ürününü “dünyayı sarsacak bir model” diye nitelendirdi.

(Yukarıdaki yazı Euronews sitesinden alınmıştır.)

ZAFER ÖZCİVAN

Ekonomist-Yazar

zozcivan@hotmail.com

  • Benzer Haberler

    PARAYI ELDE TUTMAK YERİNE HARCAMANIN TERCİH EDİLMESİ

    PARAYI ELDE TUTMAK YERİNE HARCAMANIN TERCİH EDİLMESİ Ekonomik belirsizliklerin arttığı, enflasyonun gündelik hayatın ayrılmaz bir parçası hâline geldiği dönemlerde bireylerin para ile kurduğu ilişki de köklü biçimde değişiyor. Klasik iktisat öğretisinin “tasarruf et, biriktir, geleceğini güvence altına al” yaklaşımı, son yıllarda yerini giderek daha farklı bir davranış kalıbına bırakıyor: Parayı elde tutmak yerine harcamayı tercih etmek. İlk bakışta irrasyonel gibi görünen bu eğilim, aslında hem ekonomik koşulların hem de toplumsal psikolojinin doğal bir sonucu olarak karşımıza çıkıyor. Paranın Zamanla Eriyen Değeri Yüksek enflasyon ortamlarında paranın en temel işlevlerinden biri olan “değer saklama” özelliği ciddi biçimde zayıflar. Bugün cebinizde duran para, bir yıl sonra aynı alım gücünü sunmayacaktır. Bu gerçek, özellikle sabit gelirli kesimlerde güçlü bir farkındalık yaratmış durumda. İnsanlar artık parayı elde tutmanın bir kazanç değil, aksine örtük bir kayıp anlamına geldiğini daha net görüyor. Bu noktada harcama davranışı bir savurganlık göstergesi olmaktan çıkar; aksine bir tür rasyonel savunma mekanizmasına dönüşür. “Bugün almazsam yarın daha pahalı olacak” düşüncesi, yalnızca büyük yatırımlarda değil, gündelik tüketim kalıplarında da belirleyici hâle gelir. Dayanıklı tüketim mallarından konuta, elektronik ürünlerden temel gıdaya kadar geniş bir yelpazede öne çekilmiş talep gözlemlenir. Tasarrufun Psikolojik Eşiği Tasarruf etmek yalnızca ekonomik değil, aynı zamanda psikolojik bir eylemdir. Geleceğe dair güven duygusu zayıfladığında, bireylerin uzun vadeli planlar yapması da zorlaşır. “Nasıl olsa şartlar sürekli değişiyor” algısı, tasarrufun anlamını sorgulatır. Böyle bir atmosferde para biriktirmek, geleceği garanti altına almak yerine bugünkü yaşamdan feragat etmek gibi algılanabilir. Bu nedenle harcama, sadece ekonomik bir tercih değil, aynı zamanda psikolojik bir rahatlama aracı hâline gelir. İnsanlar, kontrol edemedikleri makro riskler karşısında, en azından bugünkü yaşam standartlarını korumaya odaklanır. Harcama eylemi, belirsizlik karşısında “şimdi ve burada” olmanın bir ifadesine dönüşür. Tüketim Toplumundan Deneyim Toplumuna Parayı elde tutmak yerine harcamanın tercih edilmesi, sadece zorunlu ihtiyaçlarla sınırlı değildir. Son yıllarda deneyim odaklı harcamaların artması bu eğilimi açıkça gösteriyor. Seyahat, yeme-içme, kültürel etkinlikler ve kişisel gelişim harcamaları, “yarın ne olacağı belli değil” düşüncesiyle daha fazla öncelik kazanıyor. Bu dönüşüm, klasik tüketim toplumundan farklı bir noktaya işaret eder. Artık mesele yalnızca mal sahibi olmak değil; anı biriktirmek, yaşam kalitesini bugünden artırmaktır. Paranın elde tutulması yerine harcanması, bu bağlamda kısa vadeli mutluluğu ve tatmini önceleyen bir yaşam stratejisi olarak okunabilir. Makroekonomik Etkiler: Canlanan Talep, Artan Riskler Bireysel düzeyde rasyonel görünen bu davranış, makroekonomik ölçekte karmaşık sonuçlar doğurur. Harcamanın artması, iç talebi canlandırır; üretim, istihdam ve vergi gelirleri açısından kısa vadede olumlu etkiler yaratır. Özellikle durgunluk riskinin olduğu dönemlerde tüketimin canlı kalması, ekonominin çarklarının dönmesini sağlar. Ancak bu eğilimin uzun süreli ve kontrolsüz hâle gelmesi, başka sorunları da beraberinde getirir. Tasarruf oranlarının düşmesi, finansal sistemde kaynak maliyetlerini artırır. Yatırımlar için gerekli uzun vadeli fonların azalması, büyümenin kalitesini olumsuz etkileyebilir. Bu nedenle parayı harcamaya yönelme, dengeleyici politikalarla desteklenmediğinde kırılganlık yaratma potansiyeline sahiptir. Yeni Normal mi, Geçici Bir Refleks mi? Asıl soru şudur: Parayı elde tutmak yerine harcamanın tercih edilmesi kalıcı bir davranış değişikliği mi, yoksa olağanüstü koşulların yarattığı geçici bir refleks mi? Bu sorunun yanıtı, ekonomik istikrarın yeniden tesis edilip edilemeyeceğiyle yakından ilişkilidir. Enflasyonun kontrol altına alındığı, gelirlerin öngörülebilir hâle geldiği bir ortamda tasarruf yeniden anlam kazanacaktır. Ancak bugünün koşullarında bireylerin verdiği mesaj nettir: Para bekledikçe değer kazanmıyor, harcandıkça anlam kazanıyor. Bu mesajı doğru okumak hem ekonomi yönetimi hem de finansal kurumlar açısından…

    TÜRKİYE’DE RESMİ TATİLLER VE EKONOMİK MALİYETLERİ

    TÜRKİYE’DE RESMİ TATİLLER VE EKONOMİK MALİYETLERİ Türkiye’de resmi tatiller hem toplumsal bir gereklilik hem de ekonomik bir denge konusu olarak her yıl iş dünyasının gündeminde ön sıralarda yer alıyor. 2026 yılı itibarıyla ülkemizde 14 gün civarında resmi tatil bulunuyor. Bu tatiller, 1 Ocak Yılbaşı, 23 Nisan Ulusal Egemenlik ve Çocuk Bayramı, 19 Mayıs Atatürk’ü Anma, Gençlik ve Spor Bayramı, 30 Ağustos Zafer Bayramı ve 29 Ekim Cumhuriyet Bayramı gibi ulusal önem taşıyan günleri içeriyor. Ayrıca dini bayramlar olan Ramazan Bayramı ve Kurban Bayramı da ekonomik ve sosyal hayat üzerinde ciddi etkiler bırakıyor. Resmi tatillerin en görünür etkisi, çalışma günlerinin azalması ve üretimin bir süreliğine durmasıdır. Türkiye İstatistik Kurumu (TÜİK) verilerine göre, Türkiye’de hizmet sektörü ve sanayi üretimi tatillerden doğrudan etkileniyor. Örneğin sanayi sektöründe bir günlük üretim kaybı, yıllık ciro üzerinden hesaplandığında milyarlarca lira değerinde olabilir. Türkiye’nin sanayi üretimi 2025 yılında yaklaşık 1,2 trilyon TL düzeyindeyken, resmi tatillerin ortalama maliyeti yıllık bazda 25–30 milyar TL civarında tahmin ediliyor. Bu rakam, tatil günlerinin toplam iş gücü kaybını ve üretim kaybını kapsıyor. Ekonomistler, resmi tatillerin maliyetini sadece üretim kaybıyla sınırlı görmenin eksik olacağını vurguluyor. Tatiller aynı zamanda tüketim davranışlarını da etkiliyor. Örneğin, Ramazan Bayramı ve Kurban Bayramı dönemlerinde gıda, giyim, ulaşım ve konaklama sektörlerinde yoğun bir tüketim artışı yaşanıyor. Bu durum kısa vadeli bir ekonomik hareketlilik yaratırken, üretim kaybının maliyetini bir miktar telafi edebiliyor. Özellikle turizm ve perakende sektörleri, resmi tatil dönemlerinde ciddi kazançlar elde ediyor. İstanbul Ticaret Odası (İTO) verilerine göre, 2025 yılında bayram tatilleri perakende sektöründe ortalama yüzde 12’lik ek bir ciro artışı sağladı. Ancak Türkiye’deki resmi tatillerin maliyeti, sadece ekonomi rakamlarıyla ölçülemiyor. İşgücü piyasası üzerinde de etkileri gözlemleniyor. Özel sektörde çalışan işçiler, resmi tatillerde ücretli izin hakkına sahip olsa da bazı sektörlerde vardiyalı veya acil üretim gerektiren işler nedeniyle ek maliyetler ortaya çıkabiliyor. Özellikle enerji, telekomünikasyon ve sağlık sektörlerinde tatil günü mesai ücretleri, normal günlük ücretin yüzde 50–100 fazlasıyla hesaplanıyor. Bu da işletmeler için doğrudan bir nakit çıkışı anlamına geliyor. Avrupa örnekleriyle karşılaştırıldığında, Türkiye’de resmi tatillerin ekonomik maliyeti oldukça yüksek. Almanya’da yılda ortalama 9–10 resmi tatil bulunurken, Fransa’da bu sayı 11, İtalya’da ise 12 civarında. Türkiye’de tatil günlerinin yoğunluğu ve uzun dini bayram tatilleri, işgücü ve üretim açısından maliyetleri artırıyor. Ancak Türk ekonomisinin dinamik yapısı, özellikle hizmet ve turizm sektöründeki esneklik, bu kayıpların bir kısmını telafi edebiliyor. Bir diğer kritik nokta ise işgücü motivasyonu ve toplumsal fayda. Araştırmalar, düzenli tatillerin iş verimliliğini artırdığını ve çalışanların psikolojik sağlığını desteklediğini gösteriyor. İşverenler kısa vadede üretim kaybı yaşasa da çalışanların uzun vadeli motivasyonu ve iş verimliliği, tatillerin dolaylı ekonomik faydalarını oluşturuyor. TÜİK’in 2025 İşgücü Anketi verilerine göre, çalışanların yüzde 78’i resmi tatillerin ruhsal ve bedensel sağlık üzerinde olumlu etkisi olduğunu belirtiyor. Buna karşılık, ekonomik kayıpların minimize edilmesi için alternatif çözümler de gündemde. Esnek çalışma modelleri, uzaktan çalışma ve kısmi üretim planlaması, tatil günlerinde üretimin tamamen durmasını engelleyebiliyor. Özellikle dijitalleşme ve otomasyon yatırımlarının yaygınlaşması, tatillerin ekonomik maliyetlerini düşürme potansiyeli taşıyor. Örneğin bazı fabrikalarda kritik üretim süreçleri robotik sistemlerle yürütülerek, insan işgücü tatildeyken üretim devam ettirilebiliyor. Sonuç olarak, Türkiye’de resmi tatillerin ekonomik maliyetleri hem doğrudan üretim kaybı hem de dolaylı olarak işgücü ve tüketim dengesi üzerinden ölçülüyor. Maliyetler yüksek görünse de tatillerin toplumsal faydaları ve kısa vadeli tüketim artışları, bu kayıpların bir kısmını dengeliyor. Ekonomistler, üretim…