Wikipedia Enterprise telah mengumumkan kemitraan dengan Keggle untuk menawarkan kumpulan data Wikipedia kepada perusahaan guna melatih model kecerdasan buatan (AI). Data yang disediakan telah dioptimalkan agar model dapat dilatih tanpa tautan dan kode pemformatan teks, sehingga mengatasi gangguan lalu lintas halaman yang disebabkan oleh bot. Keggle akan membayar Wikipedia Enterprise atas penggunaan data ini, dengan atribusi sesuai lisensi Creative Commons dan Lisensi Dokumentasi Bebas GNU (GFDL).
Kolaborasi antara Wikipedia dan Keggle, anak perusahaan Google, akan menyediakan kumpulan data dalam bahasa Inggris dan Prancis. Data tersebut telah disesuaikan agar model dapat dilatih tanpa membawa tautan dan kode pemformatan teks seperti yang biasa ada di Wikipedia. Keputusan untuk menyediakan data ini diambil setelah adanya gangguan lalu lintas situs yang disebabkan oleh bot yang mencoba mencuri artikel untuk melatih model tanpa izin.
Menurut laporan terbaru, jumlah lalu lintas yang mengakses konten multimedia di Wikipedia meningkat hingga 50% tahun lalu karena aktivitas bot. Keggle akan mengganti penggunaan data ini kepada Wikipedia Enterprise, dengan ketentuan bahwa semua data yang digunakan akan tetap berada di bawah lisensi Creative Commons Attribution-Share-Alike 4.0 dan Lisensi Dokumentasi Bebas GNU (GFDL). Hal ini bertujuan untuk menciptakan kerja sama yang adil dan bermanfaat bagi kedua belah pihak.