Elon Musk Sebut Pengembangan AI Sudah Mentok Gunakan Data Dunia Nyata

Daftar Isi

Elon Musk, pemilik media sosial X dan pendiri xAI, baru-baru ini mengungkapkan bahwa pengembangan kecerdasan buatan (AI) telah mencapai titik jenuh karena evaluasi informasi. Para pengembang AI telah menggunakan hampir semua data nyata, dan sekarang mulai menggunakan data sintesis.

Kami sekarang pada dasarnya telah menghabiskan jumlah kumulatif pengetahuan manusia dalam pelatihan AI... Itu terjadi pada tahun lalu," kata Elon Musk, dalam percakapan siaran langsung dengan Ketua Stagwell, Mark Penn, dikutip dari Techcrunch, Kamis (8/1).

Pernyataan Musk dihaluskan dengan pandangan yang disampaikan beberapa ahli AI, termasuk mantan Kepala Ilmuwan OpenAI, Ilya Sutskever. Dia menyebutkan industri AI telah mencapai data puncak.

Sutskever memperkirakan kurangnya data pelatihan dunia nyata akan mendorong perubahan besar dalam cara pengembangan model AI.

Musk juga menyatakan bahwa untuk melanjutkan pembangunan AI, diperlukan penggunaan data sintetis yang dihasilkan oleh model AI itu sendiri.

"Satu-satunya cara untuk melengkapi data nyata adalah dengan data sintetis, di mana AI menciptakan data pelatihan," katanya.

Pengolahan data sintetik memungkinkan Kemampuan Buatan (AI) untuk menyetak dirinya sendiri dan maju melalui proses pembelajaran otomatis.

Beberapa perusahaan besar, termasuk Microsoft, Meta, OpenAI, dan Anthropic, telah menggunakan data sintetis untuk melatih model-model AI. Bahkan, Gartner memperkirakan pada 2024 sebanyak 60% data yang digunakan untuk proyek AI dan analitik akan dihasilkan secara sintetis.

Microsoft, melalui Phi-4, serta Google dengan model Gemma, juga telah melatih model mereka menggunakan kombinasi dari data nyata dunia dan data sintetis. Demikian juga Meta telah memaksimalkan beberapa sistem canggih mereka menggunakan data sintetis.

Sistem data sintetis menawarkan berbagai keuntungan, salah satunya adalah biaya hemat.

Misalnya, startup AI, Writer, mengklaim bahwa model Palmyra X 004 yang dikembangkan dengan sebagian besar data sintetis hanya memerlukan biaya US$700.000 atau sekitar RP 11,3 miliar (kurs Rp16.188 per US$), jauh lebih murah dari perkiraan biaya US$4,6 juta atau Rp74,4 miliar untuk model OpenAI dengan ukuran yang serupa.

Penggunaan data sintetis juga membawa tantangan besar. Beberapa penelitian menunjukkan bahwa terlalu banyak ketergantungan pada data sintetis dapat menyebabkan kegagalan model.

Dengan kata lain, model AH menjadi kurang kreatif dan lebih bias, yang berpotensi merusak fungsionalitasnya. Mengingat data yang digunakan untuk melatih model ini juga memiliki potensi bias dan keterbatasan, hasil yang dihasilkan bisa jadi tercemar dengan cara yang sama.

Posting Komentar