Zıplanacak içerik
View in the app

A better way to browse. Learn more.

Tartışma ve Paylaşımların Merkezi - Türkçe Forum - Turkish Forum / Board / Blog

Ana ekranınızda anlık bildirimler, rozetler ve daha fazlasıyla tam ekran uygulama.

To install this app on iOS and iPadOS
  1. Tap the Share icon in Safari
  2. Scroll the menu and tap Add to Home Screen.
  3. Tap Add in the top-right corner.
To install this app on Android
  1. Tap the 3-dot menu (⋮) in the top-right corner of the browser.
  2. Tap Add to Home screen or Install app.
  3. Confirm by tapping Install.

Bir teknoloji şirketinin milyonlarca kitabı yok etmeye yönelik gizli planının iç yüzü

Featured Replies

Gönderi tarihi:
  • Admin

Bir teknoloji şirketinin milyonlarca kitabı yok etmeye yönelik gizli planının iç yüzü

2024 yılının başlarında, yapay zeka girişimi Anthropic'in yöneticileri, gizli tutmaya çalıştıkları iddialı bir projeyi hızlandırdılar. Geçen hafta yasal belgelerde ortaya çıkan bir iç planlama belgesinde, "Panama Projesi, dünyadaki tüm kitapları tahrip edici bir şekilde tarama çabamızdır" deniyordu. "Bunun üzerinde çalıştığımızın bilinmesini istemiyoruz."

books-5937716.jpg

Belgelere göre, şirket yaklaşık bir yıl içinde, popüler sohbet robotu Claude gibi ürünlerin arkasındaki yapay zeka modellerine daha fazla bilgi sağlamak için milyonlarca kitabı satın almak ve ciltlerini kesmek, ardından sayfalarını taramak için on milyonlarca dolar harcadı.

Daha önce bildirilmemiş olan Panama Projesi'nin ayrıntıları, yatırımcılar tarafından 183 milyar dolar değerinde olduğu tahmin edilen Anthropic'e karşı kitap yazarları tarafından açılan bir telif hakkı davasındaki 4.000'den fazla sayfalık belgede ortaya çıktı. Şirket, Ağustos ayında davayı çözmek için 1,5 milyar dolar ödedi, ancak geçen hafta bir bölge yargıcının davadaki çok sayıda belgeyi kamuoyuna açıklaması, Anthropic'in kitaplara yönelik yoğun çabasını daha ayrıntılı olarak ortaya koydu.

Yeni belgeler, diğer yapay zeka şirketlerine karşı açılan diğer telif hakkı davalarındaki önceki belgelerle birlikte, Anthropic, Meta, Google ve OpenAI gibi teknoloji firmalarının yazılımlarını "eğitmek" için devasa veri yığınlarını elde etmek için ne kadar ileri gittiklerini gösteriyor.

Anthropic davası, yazarlar, sanatçılar, fotoğrafçılar ve haber kuruluşları tarafından yapay zeka şirketlerine karşı açılan bir dizi davanın parçasıydı. Davalardaki belgeler, önde gelen teknoloji firmalarının insanlığın toplu eserlerini elde etmek için çılgın, bazen de gizli bir yarış içinde olduklarını gösteriyor.

Mahkeme kayıtlarına göre, kitaplar şirketler tarafından çok önemli bir ödül olarak görülüyordu. Ocak 2023 tarihli bir belgede, Anthropic'in kurucu ortaklarından biri, yapay zeka modellerini kitaplar üzerinde eğitmenin, onlara "düşük kaliteli internet dilini" taklit etmek yerine "iyi yazmayı" öğretebileceği teorisini ortaya attı. Meta'daki 2024 tarihli bir e-postada, dijital kitap arşivine erişimin yapay zeka rakipleriyle rekabet edebilmek için "çok önemli" olduğu belirtiliyordu.

Ancak mahkeme kayıtları, şirketlerin eserlerini kullanmak için yayıncılardan ve yazarlardan doğrudan izin almayı pratik bulmadıklarını gösteriyor. Bunun yerine, mahkeme belgelerine göre Anthropic, Meta ve diğer şirketler, yazarların bilgisi olmadan toplu olarak kitaplar edinmenin yollarını buldular; buna korsan kopyaları indirmek de dahil.

Meta çalışanları, birçok kez iç yazışmalarda, milyonlarca kitaptan oluşan bir koleksiyonu izinsiz olarak indirmenin telif hakkı yasasını ihlal edeceğine dair endişelerini dile getirdi. Kitap yazarlarının şirkete karşı açtığı telif hakkı davasındaki dosyalara göre, Aralık 2023'te gönderilen bir iç e-postada, bu uygulamanın "MZ'ye iletildikten sonra" onaylandığı belirtildi; bu da görünüşe göre CEO Mark Zuckerberg'e bir gönderme. Meta, bu haberle ilgili yorum yapmayı reddetti.

Yeni yayınlanan bir yasal belgede, Anthropic, kurucu ortak Ben Mann'ın Haziran 2021'de 11 günlük bir süre boyunca LibGen adlı, telif hakkı ihlali içeren kitaplar ve diğer içeriklerden oluşan bir "gölge kütüphaneden" kurgu ve kurgu dışı eserler indirdiğini açıkladı. Dosyalarda yer alan web tarayıcısının ekran görüntüsünde, dosya paylaşım yazılımıyla dosyaları indirdiği görülüyor.

Bir yıl sonra Mann, Temmuz 2022'de, büyük bir kitap veritabanına sahip olduğunu iddia eden ve "çoğu ülkede telif hakkı yasasını kasıtlı olarak ihlal ediyoruz" diyen Pirate Library Mirror adlı yeni bir web sitesinin açılışını kutladı. Mann, siteye ait bağlantıyı diğer Anthropic çalışanlarına "tam zamanında!!!" mesajıyla gönderdi.

Anthropic, yasal belgelerde, şirketin LibGen verilerini kullanarak gelir elde eden ticari bir yapay zeka modeli eğitmediğini ve Pirate Library Mirror'ı herhangi bir yapay zeka modelini eğitmek için kullanmadığını belirtti.

Eski bir yapay zeka yöneticisi ve müzik bestecisi olan ve şu anda yaratıcıların haklarını savunan bir kar amacı gütmeyen kuruluşu yöneten Ed Newton-Rex, bu açıklamaların yapay zeka şirketlerinin yaratıcılara bugüne kadar ödediklerinden daha büyük bir borçlu olduklarını gösterdiğini söyledi. "Yapay zeka sektöründe acilen bir sıfırlamaya ihtiyacımız var; böylece yaratıcılar yaptıkları hayati katkılar için adil bir şekilde ödeme almaya başlasınlar," dedi.

Google, Microsoft ve ChatGPT'nin üreticisi OpenAI de benzer iddialarla kitap yazarlarından telif hakkı davalarıyla karşı karşıya. (Washington Post'un OpenAI ile içerik ortaklığı bulunmaktadır.)

Yapay zeka şirketlerine karşı açılan davaların çoğu hala devam ediyor ve Cornell Tech'te dijital ve bilgi hukuku profesörü James Grimmelmann, bu davaların ortaya koyduğu soruların hala çözülmemiş hukuk konuları olduğunu söyledi. Ancak iki erken kararda, yargıçlar, teknoloji şirketlerinin bir yazarın veya yayıncının izni olmadan yapay zeka modellerini eğitmek için kitapları kullanmasının, telif hakkı hukukunda "adil kullanım" olarak bilinen bir doktrin kapsamında yasal olabileceğine karar verdi. Haziran ayında Bölge Yargıcı William Alsup, Anthropic'in yapay zeka modellerini eğitmek için kitapları kullanma hakkına sahip olduğuna karar verdi, çünkü şirket materyali "dönüştürücü" bir şekilde işliyordu. Yargıç, yapay zeka eğitim sürecini öğretmenlerin "öğrencilere iyi yazmayı öğretmesine" benzetti. Aynı ay, Bölge Yargıcı Vince Chhabria, Meta davasında, kitap yazarlarının şirketin yapay zeka modellerinin kitaplarının satışlarına zarar verebileceğini gösteremediklerine karar verdi.

Ancak şirketler, kitapları nasıl edindikleri konusunda yine de sorun yaşayabilirler. Anthropic davasında, kitap tarama projesi onaylandı, ancak yargıç, şirketin Project Panama'yı başlatmadan önce milyonlarca korsan kitabı ücretsiz olarak indirdiğinde yazarların telif haklarını ihlal etmiş olabileceğine karar verdi.

Alsup, kitapları Anthropic'in indirip gelecekte kullanmak üzere sakladığı, yetkisiz olarak çevrimiçi olarak paylaşılan devasa dijital kitap koleksiyonları olan iki "gölge kütüphanede" yer alan yazarlara toplu dava statüsü verdi. Şirket, yargılamayla karşı karşıya kalmak yerine, herhangi bir yanlış yaptığını kabul etmeden yayıncılara ve yazarlara 1,5 milyar dolar ödemeyi kabul etti. Kitapları indirilen yazarlar, başlık başına yaklaşık 3.000 dolar olarak tahmin edilen uzlaşma paylarını talep edebilirler.

Anthropic'in genel müdür yardımcısı Aparna Sridhar, Washington Post'a gönderdiği bir e-postada, "Bu dava çözüldü, ancak mahkemenin Haziran 2025 tarihli dönüm noktası niteliğindeki kararı geçerliliğini koruyor" dedi. "Yargıç Alsup, yapay zeka eğitiminin 'özünde dönüştürücü' olduğuna karar verdi: Anthropic'in yapay zeka modelleri, eserleri 'kopyalamak veya yerini almak için değil, farklı bir şey yaratmak için' eğitildi. Çözüme kavuşturduğumuz konu, bazı materyallerin nasıl edinildiğiyle ilgiliydi, bunları yapay zeka modelleri geliştirmek için kullanıp kullanamayacağımızla ilgili değildi."

Satın al, kes, tarat, geri dönüştür

Anthropic, fiziksel kitapları satın almak ve taramak için başlattığı Project Panama operasyonunda, Silikon Vadisi'nin deneyimli isimlerinden birine başvurdu. Şirket, yirmi yıl önce arama devi Google'ın ünlü ancak yasal olarak tartışmalı Google Kitaplar projesinin oluşturulmasına yardımcı olan Google yöneticisi Tom Turvey'i işe aldı.

Dosyalara göre Anthropic, başlangıçta kütüphanelerden veya New York'taki ünlü Strand gibi ikinci el kitapçılardan kitap satın almayı düşündü. Mart 2024 tarihli bir Anthropic içerik edinme toplantısını detaylandıran bir belgeye göre, mağaza "ikinci el kitap sağlamakla ilgileniyordu".

Belgelere göre Anthropic çalışanları ayrıca New York Halk Kütüphanesi de dahil olmak üzere ABD kütüphanelerine veya "kronik olarak yetersiz finanse edilen yeni bir kütüphaneye" yaklaşmayı da görüştüler.

Anthropic'in bu önerilerden hangilerini uyguladığı belli değil. E-posta yoluyla ulaşılan Strand sözcüsü, kitapçının Anthropic'e herhangi bir kitap satmadığını söyledi. NYPL yorum talebine yanıt vermedi.

Dosyalara göre Anthropic sonunda milyonlarca kitap satın aldı, genellikle on binlerce kitaplık partiler halinde. İkinci el kitap perakendecileri Better World Books ve İngiltere merkezli World of Books gibi kitap satıcılarına güvendi.

Taranan kitapların nihai sayısı ve maliyeti belgelerde gizlenmiş durumda, ancak Anthropic ile nihayetinde çalışan bir satıcının proje önerisinde, yapay zeka şirketinin "altı aylık bir süre içinde 500.000 ila iki milyon kitabı dönüştürmek için deneyimli bir belge tarama hizmetleri satıcısı aradığı" belirtiliyor.

Better World Books ve World of Books Pazartesi günü yorum taleplerine yanıt vermedi.

Belge, tarama şirketinin "hidrolik güçle çalışan kesme makinesinin" kitapları "düzenli bir şekilde keseceğini", sayfaların daha sonra "yüksek hızlı, yüksek kaliteli, üretim seviyesinde tarayıcılarda taranacağını" açıklıyor. Son olarak, tarama şirketinin "tamamlanan kitapları almak için geri dönüşüm şirketiyle program yapacağını" belirtiyor.

'Doğru gelmiyor'

Meta'ya karşı açılan telif hakkı davasında yayınlanan belgeler, sosyal ağ devinin çalışanlarının da daha fazla veri için aç olduğunu ve bunu elde etmek için yasal riskler almaya istekli olduklarını gösteriyor. Yargıç Chhabria, yapay zeka modellerini eğitmek için kitapların kullanılması konusunda Meta'nın lehine karar verirken, yazarların Meta'nın korsan kitapların kopyalarını yasa dışı olarak dağıttığı iddialarıyla davaya devam etmelerine izin verdi. Davacılar, bu iddialar için Kuzey Kaliforniya Bölge Mahkemesi'nde toplu dava statüsü talep ediyorlar.

Davacılar, davalarında Meta'nın üst düzey yöneticilerinin yapay zeka modellerini eğitmek için kitaplara ödeme yapmayı düşündüklerini, ancak bunun yerine çevrimiçi korsanlığı kolaylaştıran "torrent" platformlarından milyonlarca kitabı ücretsiz olarak indirmeyi tercih ettiklerini iddia ettiler. Platformların tasarımı genellikle materyal yükleyen kullanıcıları, büyük dosya koleksiyonlarının daha hızlı indirilmesiyle ödüllendiriyor.

Daha önce de bazıları haberlere konu olan iç belgeler, Meta çalışanlarının yaptıklarının riskli veya yanlış olduğu konusunda endişelerini dile getirdiklerini ve izlerini nasıl gizleyeceklerini tartıştıklarını gösterdi.

Belgelere göre, bir mühendis 2023 yılında "Kurumsal bir dizüstü bilgisayardan torrent indirmek doğru gelmiyor" diye yazdı. Aynı çalışan daha sonra şirketin hukuk ekibiyle, torrent sitelerini kullanmanın korsan eserleri başkalarıyla paylaşmayı gerektirebileceği ve bunun "yasal olarak uygun olmayabileceği" konusunda endişesini paylaştı.

Mahkeme dosyalarındaki Aralık 2023 tarihli e-posta, LibGen kullanımının, görünüşe göre baş harfleriyle anılan Zuckerberg tarafından onaylandığını açıkça ortaya koyuyor. E-postada, "MZ'ye yapılan önceki bir bilgilendirmeden sonra, GenAI'nin Llama 3 için LibGen'i kullanması, üzerinde anlaşılan bir dizi önlemle birlikte onaylandı" deniyor ve ardından verilerin kullanımına ilişkin yasal ve politika riskleri sıralanıyor.

E-postada ayrıca, "Eğer LibGen gibi korsan olduğunu bildiğimiz bir veri setini kullandığımıza dair medya haberleri çıkarsa, bu durum düzenleyicilerle bu konulardaki müzakere pozisyonumuzu zayıflatabilir" ifadeleri yer alıyor.

Nisan 2024'e gelindiğinde, şirket içi iletişimler şirketin LibGen ve diğer gölge kütüphaneleri indirmeye başladığını gösteriyordu. Sohbet kayıtları, bir çalışanın diğerine, Facebook'a ait sunucular yerine Amazon'dan kiralanan sunucuları neden torrent indirme için kullandıklarını açıklamasını istediğini gösteriyor. Cevap ise: "Faaliyetin şirkete kadar izlenmesi riskinden kaçınmak."

Geçen ay yapılan bir başvuruda Meta'nın avukatları, şirketin "eğitim verilerini torrent kullanarak indirdiğinde davacıların eserlerini dağıttığı iddialarını reddettiğini" yazdı.

2023 yılında açılan ayrı bir davada, kitap yazarları OpenAI ve Microsoft'u da yapay zeka eğitimi için kitap arayışlarında telif hakkı yasasını ihlal etmekle suçladı. Mann ve Anthropic CEO'su Dario Amodei'nin şirketi kurmadan önce çalıştığı OpenAI, LibGen'i indirdiğini kabul etti ancak mahkemeye dosyaları ChatGPT'nin piyasaya sürülmesinden önce sildiğini söyledi.

Hem OpenAI hem de Anthropic davalarında kitap yazarlarını temsil eden Susman Godfrey LLP avukatı Justin A. Nelson, "OpenAI, yapay zeka şirketleri tarafından yaygın korsanlığa ve tüm insanlığın ifade biçimlerinin sömürülmesine yol açan başlangıç sinyalini verdi" dedi. OpenAI bu haberle ilgili yorum yapmayı reddetti.

Bu ayın başlarında, iki büyük yayıncı, 2023 yılında açılan bir telif hakkı davasında yazarlar ve illüstratörlerden oluşan bir gruba katılmalarına izin verilmesi için mahkemeye başvurdu.

Cornell Tech hukuk profesörü Grimmelmann, yapay zeka şirketlerinin telif hakkıyla korunan verilerin kullanımı konusunda "kendilerini bir yanılgıya düşürdüklerini" söyledi. ChatGPT ve benzeri araçların arkasındaki atılımların, telif hakkıyla korunan materyalin eğitim için kullanılmasının geniş çapta kabul gördüğü akademik araştırmalarda başladığını belirten Grimmelmann, araştırmacıların yapay zeka modelleri ticarileştirilirken bile bu uygulamaya devam ettiklerini söyledi. Grimmelmann, "Gerilim belirginleştiğinde, telif hakkıyla korunan verileri sistemlerine entegre etmek için büyük yatırımlar yapmışlardı ve daha yeni ve daha iyi modelleri piyasaya sürmek için hızlı tempolu, yüksek riskli bir rekabetin içindeydiler," dedi.

Anthropic'in gölge kütüphanelerden indirmek yerine fiziksel kitapları edinmeye ve taramaya başlamasının "akıllıca bir karar olduğu ortaya çıktı," diye ekledi. "Bu, şirketin daha ölçülü bir yaklaşım benimseyerek yasal uyumluluğu sağladığına dair iyi bir örnek olacaktır."

Kaynak: TWP

Katılın Görüşlerinizi Paylaşın

Hemen ileti gönderebilir ve devamında kayıt olabilirsiniz. Hesabınız varsa, hesabınızla gönderi paylaşmak için ŞİMDİ OTURUM AÇIN.
Eğer üye değilseniz hemen KAYIT OLUN.
Not: İletiniz gönderilmeden önce bir Moderatör kontrolünden geçirilecektir.

Misafir
Maalesef göndermek istediğiniz içerik izin vermediğimiz terimler içeriyor. Aşağıda belirginleştirdiğimiz terimleri lütfen tekrar düzenleyerek gönderiniz.
Bu başlığa cevap yaz

Önemli Bilgiler

Bu siteyi kullanmaya başladığınız anda kuralları kabul ediyorsunuz Kullanım Koşulu.

Tarayıcı push bildirimlerini yapılandırın

Chrome (Android)
  1. Tap the lock icon next to the address bar.
  2. Tap Permissions → Notifications.
  3. Adjust your preference.
Chrome (Desktop)
  1. Click the padlock icon in the address bar.
  2. Select Site settings.
  3. Find Notifications and adjust your preference.