WIKIMEDIA Enterprise kini menawarkan sebahagian set data Wikipedia kepada syarikat yang ingin menggunakannya untuk melatih model kecerdasan buatan (AI).


Ringkasan AI
  • Wikimedia Enterprise menawarkan set data Wikipedia kepada syarikat untuk melatih model kecerdasan buatan (AI), bekerjasama dengan Keggle.
  • Data dioptimasi untuk melatih model tanpa pautan dan kod format teks, mengatasi masalah trafik laman yang dihentam bot.
  • Keggle akan membayar Wikipedia Enterprise untuk data ini, dengan atribut di bawah pelesenan Creative Commons dan GNU Free Documentation License (GFDL).


Mereka bekerjasama dengan Keggle – sebuah anak syarikat Google – untuk menawarkan set data terpilih dalam Bahasa Inggeris dan Perancis.

Data telah dioptimasi untuk melatih model dengan ia tidak mengandungi pautan dan kod untuk memformat teks seperti yang ditawarkan di Wikipedia.

Langkah menawarkan set data ini dilakukan kerana trafik laman yang dihentam teruk oleh bot yang ingin mencuri artikel bagi melatih model tanpa kebenaran.

Bulan lalu Wikipedia berkata jumlah trafik yang mengakses kandungan multimedia meningkat 50% tahun lalu disebabkan aktiviti bot.

Keggle akan membayar Wikipedia Enterprise untuk menggunakan data ini.

Pada waktu yang sama semua data yang digunakan akan memberikan atribut kembali di bawah pelesenan Creative Commons Attribution-Share-Alike 4.0 dan GNU Free Documentation License (GFDL). -Amanz