Zuckerberg LLAMA AI dil modellerini korsan verilerle eğitti! Meta'ya davalar yağdı
Meta CEO'su Mark Zuckerberg'in, şirketin yapay zeka modelleri ekibine korsan e-kitaplar ve makalelerle eğitim izni verdiği iddiası gündemde. Bu iddialar üzerine açılan davalarda gizlilik talebi reddedildi ve şirket iç yazışmaları da gündeme düştü
Yapay zekanın gelişiminde büyük dil modellerinin (LLM) eğitimi, modern teknolojinin en önemli ve hızlı ilerleyen alanlarından bir tanesi olarak dikkat çekiyor. Bu modeller, devasa miktarda metin verisi üzerinde eğitim alarak, doğal dil işleme ve anlama görevlerinde inanılmaz bir performans sergiliyor. Büyük dil modelleri, dil tabanlı birçok uygulamada yenilikçi çözümler sunarak, insan-makine etkileşimini daha doğal ve etkili hale getiriyor. Ancak, bu modellerin eğitimi sırasında kullanılan veri setlerinin kaynağı ve telif hakları, önemli etik ve yasal soruları da beraberinde getiriyor.
Meta CEO'su Mark Zuckerberg'in de bu konuda başı dertte. Zuckerberg'in şirketin LLAMA (Large Language Model Meta AI) yapay zeka modelleri ekibine, korsan e-kitaplar ve makaleler içeren bir veri setini kullanma izni verdiği iddiaları gündemde. Meta'ya karşı açılan Kadrey v. Meta davasında, Zuckerberg'in LibGen adlı veri setini Llama ile ilgili eğitim için kullanmaya onay verdiği belirtiliyor. Bu dava, Meta gibi büyük teknoloji şirketlerinin, yapay zeka modellerini telif hakkıyla korunan eserlerle izin almadan eğitmekle suçlandığı davalardan sadece bir tanesi.
TELİF HAKKI İHLALLERİ VE META'NIN SAVUNMASI
LibGen, telif hakkıyla korunan eserleri yayınlayan bir platform olarak birçok kez dava edildi ve milyonlarca dolar para cezasına çarptırıldı. Davacıların avukatlarının iddialarına göre, Meta çalışanları, LibGen'in "korsan bir veri seti" olduğunu biliyordu ve bunun Meta'nın düzenleyicilerle müzakeredeki konumunu zayıflatabileceğini belirttiler. Meta'nın savunması ise, ABD'nin fair use (adil kullanım) doktrini kapsamında, telif hakkıyla korunan eserleri "yeterince dönüştürücü" bir şekilde yeni bir şey oluşturmak için kullanılabileceğini iddia ediyor.
İÇ YAZIŞMALAR ORTAYA ÇIKTI
Meta'nın iç yazışmalarında, şirketin bu veri setini kullanmak için Zuckerberg'in onayını aldığı belirtiliyor. Ayrıca, Meta'nın veri setindeki telif hakkı bilgilerini kaldırmak için bir script yazdığı ve böylece olası telif hakkı ihlallerini gizlemeye çalıştığı iddia ediliyor. Meta mühendislerinin, veri setindeki telif hakkı ve kaynak bilgilerini kaldırdığı belirtiliyor.
Meta'nın LibGen'i torrentleyerek başka bir telif hakkı ihlaline de karıştığı iddialar arasında. Torrentleme, dosyaların web üzerinde dağıtılmasını sağlar ve bu süreçte Meta'nın da LibGen içeriğini yaydığı ileri sürülüyor. Meta'nın baş mühendislerinden Ahmad Al-Dahle'nin, torrentleme konusunda endişeleri olan çalışanlarının çekincelerini dikkate almadığı ve torrentleme yolunu açtığı iddia ediliyor.
Techcrunch'ın bildirdiğine göre dava, Meta'nın en eski Llama modelleriyle ilgili olmasına rağmen, şirketin fair use savunması başarılı olursa, Meta lehine sonuçlanabilir. Ancak, yargıç Vince Chhabria'nın, Meta'nın dava dosyasının büyük bölümlerinin sansürlenmesi talebini reddetmesi, davacıların iddialarının kamuoyunda yankı bulmasını sağladı. Yargıç Chhabria, Meta'nın gizlilik taleplerinin, rakiplerinin kullanabileceği hassas ticari bilgilerin ifşasını engellemek için değil, olumsuz kamuoyunu önlemek için olduğunu belirtti.
META'NIN AI MODELİ LLAMA NEDİR?
Meta tarafından geliştirilen ve geniş çaplı dil verileri üzerinde eğitim alan bir yapay zeka modeli LLAMA (Large Language Model Meta AI), büyük miktarda metin verisi üzerinde eğitim alarak, dil işleme ve anlama görevlerinde yüksek performans sergiliyor. LLAMA'nın, doğal dil işleme, metin üretimi, çeviri ve özetleme gibi dil tabanlı görevlerde kullanılmak üzere birçok farklı özelliği de bulunuyor. Meta, LLAMA'yı yapay zeka araştırmalarında ve pratik uygulamalarda yenilikçi çözümler sunmak amacıyla geliştirdiğini vurgularken. Bu model, insanların dilini daha iyi anlamak ve yanıtlamak için ileri düzey algoritmalar ve öğrenme teknikleri kullanıyor, bu da onu dil tabanlı birçok uygulamada güçlü bir araç haline getiriyor.