top of page

İlginç Gerçek: Veri Kıtlığı Kapıda

26. Juni 2024

Sözün bittiği an deyimi bu gerçek manada gerçek oluyor.

 Eğitim Yüksek Lisans Verileri Ne Zaman Bitecek?


Önümüzdeki 2 yıl içinde insanlık tarihin en tuhaf kıtlığıyla karşı karşıya kalabilir: insan yapımı metinlerin tükenmesi. Bu, dil modellerinin (LLM'ler) eğitim verilerini tüketmesine ve ölçeklendirme krizine neden olmasına yol açacaktır. Yapay zekanın dünyamız üzerindeki etkisini inceleyen araştırmacılar bu sonuca ulaştı.


Günün sayısı


300 trilyon jeton — insanlık tarafından oluşturulan ve şu anda yapay zeka modellerinin eğitimi için mevcut olan metin miktarı.


0️⃣ "Veri Kuraklığı"


2026–2032 — araştırmacılar bu dönemi, yüksek lisans eğitimine yönelik metin verilerinin tamamen tükenmesi için en muhtemel zaman dilimi olarak görüyor. Modeller yapay zeka yarışı ve popüler LLM'lerin ölçeklenmesi nedeniyle yoğun bir şekilde aşırı eğitilirse, bu daha da erken gerçekleşebilir.


Araştırmacılardan Üç Ana Sonuç


1️⃣ Metinsel veriler, daha gelişmiş LLM'lerin geliştirilmesinde darboğaz haline gelecektir.


2️⃣ Yapay zekadan elde edilen sentetik veriler hâlâ yeterince araştırılmıyor. Matematik ve programlama gibi dar alanlarda faydalıdırlar. Bazıları, yapay zekanın bunları oluştururken hata yapabileceği için bu tür verilerin tehlikeli olabileceğine inanıyor .


3️⃣ Kişisel mesajlar gibi özel verilerin yasal sorunlar nedeniyle geniş çapta kullanılması pek olası değildir.


🔠 Krize Çözümler


Araştırmacılar Yüksek Lisans'ı geliştirmek için çeşitli çözümler önermektedir:


➡️ Sentetik veriler.

➡️ Diğer veri türleri üzerine eğitim.

➡️ Veri verimliliğinin arttırılması.


💲 Verilerimi Kime Satabilirim


Şirketler zaten internet kullanıcılarına verileri için yapay zeka modellerini eğitmek için kullanılabilecek parasal ödüller sunuyor. Bunlardan bazıları:


➡️ TIKI — kullanıcıların mobil cihazlarına erişim için. TIKI ile ortak uygulamalardaki kullanıcı davranışlarıyla ilgileniyorlar.


➡️ Caden - Netflix ve Amazon'daki kişisel hesaplara erişim için. Kazançlar ayda 5 ila 50 dolar arasında değişmektedir.


➡️ Invisible, aşılar ve kullanıcıların siyasi bağlantıları hakkında bilgiler de dahil olmak üzere demografik ve davranışsal veriler karşılığında ücretli haber makalelerine erişim sunuyor. Şirket bu verileri aylık 4 ile 15 dolar arasında değişen dijital aboneliklerle takas etmeyi planlıyor.


bottom of page