Meta Mengakui Penggunaan Data Buku Bajakan, untuk Melatih Model Bahasa Besar (LLM) Llama 1 dan Llama 2

Meta Akui Pemakaian Data Buku Bajakan Untuk Latih AI
Meta Akui Pemakaian Data Buku Bajakan Untuk Latih AI
0 Komentar

Realita KitaMeta telah mengakui penggunaan dataset Books3 serta berbagai materi lainnya dalam proses pelatihan large language model (LLM) Llama 1 dan Llama 2.

Pengakuan ini muncul seiring dengan adanya gugatan dari sejumlah penulis buku terhadap Meta. Para penulis menuduh bahwa Meta menggunakan buku-buku yang dilindungi hak cipta untuk mengembangkan Llama 1 dan Llama 2.

Books3, sebuah dataset terkemuka yang mencakup teks dari 195 ribu buku yang dilindungi hak cipta, dengan ukuran file mencapai 37 GB, menjadi pusat perhatian.

Baca Juga:Circle to Search, Temukan Barang Idaman dengan Mudah di Galaxy S24 Series!Daftar Fitur AI di Samsung Galaxy S24, Meningkatkan Antusiasme!

Shawn Presser, seorang peneliti AI, menciptakan dataset ini pada tahun 2020 dengan tujuan menyediakan data yang lebih baik untuk melatih algoritma machine learning.

Banyak buku dalam dataset ini berasal dari situs bajakan buku Bibliotik, yang pada tahun 2023 disengketakan oleh Rights Alliance, sebuah kelompok anti-pembajakan asal Denmark.

Dalam gugatan tersebut, Rights Alliance menuntut pemblokiran arsip digital dataset Books3 menggunakan aturan Digital Millennium Copyright Act (DMCA).

Dataset Books3 ini kemudian banyak digunakan oleh berbagai pihak, termasuk perusahaan teknologi raksasa seperti Meta. Meta menggunakan Books3 bersama dengan berbagai dataset kontroversial lainnya untuk melatih produk AI komersialnya.

Terkait isu ini, New York Times saat ini menggugat OpenAI dan Microsoft karena dianggap menggunakan jutaan artikel yang dilindungi hak cipta mereka untuk membangun chatbot ChatGPT.

OpenAI sendiri secara terbuka menyatakan bahwa melatih model AI tanpa menggunakan materi yang dilindungi hak cipta adalah suatu hal yang tidak mungkin. Oleh karena itu, mereka meminta hakim untuk menolak gugatan permintaan kompensasi dari pemegang hak cipta.

Di sisi lain, Meta berpendapat bahwa penggunaan konten yang dilindungi hak cipta untuk melatih LLM tidak memerlukan izin, kompensasi, atau pemberian kredit kepada pemilik hak cipta.

Baca Juga:Samsung Galaxy S24 Ultra 5G, Spesifikasi dan Harga di IndonesiaInovasi Terbaru Samsung Galaxy S24 dan S24 Plus Unggul dengan Spesifikasi Mumpuni!

Meta menolak tudingan pelanggaran hak cipta dari para penggugat, dan berpendapat bahwa salinan buku tanpa izin, seperti yang terdapat dalam dataset Books3, dapat digunakan secara bebas, seperti yang dikutip oleh Realitakita.com dari Techspot pada Kamis (18/1/2024).

0 Komentar