OpenAI Pakai Video YouTube untuk Latih GPT-4, Google Beri Peringatan

virprom.com – Menurut laporan, perusahaan kecerdasan buatan kehabisan data untuk mengajarkan LLM (Large Language Model), termasuk OpenAI dan Meta.

OpenAI, perusahaan di balik ChatGPT, telah mengumumkan bahwa mereka mengalami masalah dalam mengumpulkan data pelatihan untuk model LLM generasi berikutnya, GPT-4.

Untuk mengatasi hal tersebut, perusahaan yang dipimpin oleh Sam Altman ini banyak menggunakan video YouTube.

Ada sekitar satu juta jam video YouTube yang digunakan OpenAI untuk melatih GPT-4. CEO OpenAI Greg Brockman bahkan berpartisipasi dalam video tersebut.

Video disalin menggunakan alat pengeditan audio Whisper.

Menurut pakar OpenAI Lindsay Held, perusahaan melampirkan serangkaian “data konkret” ke setiap model untuk lebih memahami dunia dan mengelola persaingan.

Baca juga: OpenAI Ingin Sora AI Digunakan untuk Pembuatan Film Hollywood, Namun Langsung Ditentang

Hold menambahkan bahwa OpenAI menggunakan berbagai sumber data, termasuk data yang tersedia untuk umum serta data non-publik dari mitra. Kini OpenAI juga telah mengonfirmasi bahwa mereka akan mempertimbangkan untuk membuat data pelatihannya sendiri.

Namun Held tidak menyebutkan dari platform mana data pelatihan model tersebut diunduh.

Siaran pers New York Times yang dikutip KompasTekno, Minggu (14 April 2024) menyebutkan OpenAI kehabisan data pelatihan pada tahun 2021.

Perusahaan kecerdasan buatan (AI) tersebut kemudian membahas praktik penulisan video, podcast, dan buku audio di YouTube.

Pada tahun yang sama, OpenAI melatih modelnya menggunakan berbagai data, termasuk kode komputer dari Github dan konten sekolah di Quizlet.

Baca juga: Potensi dan Bahaya AI Kloning Suara Peringatan Google

Google dihubungi oleh The Verge, mengklaim bahwa perusahaan tersebut telah melihat laporan OpenAI merekam video YouTube, meskipun OpenAI tidak secara langsung mengkonfirmasi hal tersebut. Google kemudian memperingatkan Anda agar tidak mengunduh konten tanpa izin.

“File .robots.txt dan Ketentuan Layanan kami melarang pengunduhan konten dari YouTube,” kata juru bicara Google Matt Bryant.

Bryant juga mengatakan pihaknya akan mengambil tindakan hukum untuk mencegah penggunaan YouTube secara ilegal jika ada bukti.

Google menurut sumber internal pada dasarnya sama dengan OpenAI, yaitu mengumpulkan data dari video YouTube. Namun Bryant berdalih pihaknya menggunakan sebagian konten YouTube berdasarkan perjanjian antara YouTube dan pembuat konten.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back To Top