Reddit Gugat Perusahaan Pengikis Data dalam Pertempuran Hak AI

4 Min Read

Reddit Inc. telah mengajukan gugatan federal terhadap perusahaan rintisan kecerdasan buatan (AI) Perplexity AI dan tiga penyedia layanan pengikis data, menuduh mereka bersekongkol untuk mencuri kontennya dalam skala industri. Gugatan ini menandai eskalasi terbaru dalam pertarungan hak data antara pemilik konten dan industri AI yang sedang berkembang pesat.

Gugatan yang diajukan di pengadilan federal New York pada Rabu, 22 Oktober 2025, menuding Perplexity AI secara ilegal menggunakan data pengguna Reddit untuk melatih model AI-nya. Bersama Perplexity, Reddit juga menyebut Oxylabs UAB dari Lituania, AWMProxy yang disebut sebagai “bekas botnet Rusia,” dan SerpApi, sebuah perusahaan yang berbasis di Texas, sebagai terdakwa. Reddit mengklaim perusahaan-perusahaan ini melewati perlindungan teknologi miliknya dan Google untuk mendapatkan data secara tidak sah.

Menurut Reddit, para pengikis data ini bekerja sama untuk mengekstrak data dengan menyamarkan identitas dan lokasi mereka, serta menyamarkan _web scraper_ mereka sebagai pengguna biasa. Karena tidak dapat mengikis langsung dari Reddit, mereka diduga mengikis konten Reddit dari hasil pencarian Google, yang lebih mudah diakses secara massal. Ben Lee, Chief Legal Officer Reddit, menegaskan bahwa “perusahaan-perusahaan AI terlibat dalam perlombaan senjata untuk konten manusia berkualitas – dan tekanan itu telah memicu ‘ekonomi pencucian data’ berskala industri,” seperti dilansir CNBC.

Reddit menyatakan bahwa Perplexity AI merupakan “pelanggan yang bersedia” dari setidaknya salah satu perusahaan pengikis data yang dituduhkan. Gugatan tersebut mengklaim bahwa Perplexity AI membeli dan menggunakan data curian tersebut untuk melatih model-modelnya dan mendukung “mesin penjawab” berbasis AI-nya. Reddit juga mengungkapkan bahwa mereka telah mengirimkan surat peringatan (cease-and-desist letter) kepada Perplexity pada Mei 2024. Namun, alih-alih menghentikan praktik tersebut, jumlah kutipan Perplexity terhadap konten Reddit justru meningkat empat puluh kali lipat setelah surat tersebut.

Perplexity AI, melalui unggahan di Reddit, membantah tuduhan tersebut, menyebut gugatan itu sebagai “contoh menyedihkan dari apa yang terjadi ketika data publik menjadi bagian besar dari model bisnis perusahaan publik.” Mereka menuduh Reddit mencoba memonetisasi datanya di tengah model bisnis yang stagnan dan berspekulasi bahwa ini adalah “tentang unjuk kekuatan dalam negosiasi data pelatihan Reddit dengan Google dan OpenAI.” Perplexity mengklaim tidak melatih model AI fundamentalnya pada konten Reddit dan hanya memberikan ringkasan dengan kutipan, menegaskan bahwa mereka mengakses data publik secara sah.

SerpApi dan Oxylabs juga telah mengeluarkan pernyataan yang menyangkal tuduhan tersebut dan berjanji akan membela diri di pengadilan. Denas Grybauskas, Chief Governance and Strategy Officer Oxylabs, menyatakan kepada Inc. bahwa “posisi Oxylabs adalah bahwa tidak ada perusahaan yang boleh mengklaim kepemilikan data publik yang bukan miliknya.” Ia juga menambahkan bahwa Reddit tidak berusaha menghubungi mereka secara langsung sebelum mengajukan gugatan.

Kasus ini menjadi sorotan penting dalam upaya Reddit untuk memonetisasi miliaran data hasil percakapan penggunanya, terutama di tengah permintaan besar akan data berkualitas untuk pelatihan AI. Reddit sebelumnya telah mengubah kebijakan datanya pada tahun 2024, yang mengharuskan entitas komersial untuk menandatangani perjanjian lisensi untuk akses data skala besar. Perusahaan media sosial ini telah memiliki perjanjian lisensi dengan raksasa teknologi seperti Google dan OpenAI untuk akses ke kontennya, berbeda dengan para terdakwa dalam kasus ini.

Gugatan ini mengikuti tindakan hukum serupa yang diajukan Reddit terhadap perusahaan rintisan AI Anthropic pada Juni 2025, atas tuduhan pengikisan data tanpa izin. Ketegangan yang terjadi menunjukkan perdebatan yang lebih luas mengenai kepemilikan data dan etika penggunaan data di era AI. Hasil dari gugatan ini diperkirakan akan memiliki implikasi signifikan terhadap masa depan kepemilikan data dan industri AI secara keseluruhan.

Share This Article