Model bahasa AI sedang booming. Pelopor saat ini adalah ChatGPT, yang dapat melakukan segalanya mulai dari mengikuti ujian pengacara, membuat kebijakan SDM, hingga menulis naskah film.
Tapi ia dan model lainnya masih belum bisa berpikir seperti manusia. Dalam Tanya Jawab ini, Dr. Vered Shwartz (dia), asisten profesor di departemen ilmu komputer UBC, dan mahasiswa master Mehar Bhatia (dia) menjelaskan mengapa penalaran bisa menjadi langkah selanjutnya dalam AI—dan mengapa penting untuk melatih model ini menggunakan beragam kumpulan data dari budaya berbeda.
Apa yang dimaksud dengan 'alasan' bagi AI?
Shwartz: Model bahasa besar seperti ChatGPT belajar dengan membaca jutaan dokumen, pada dasarnya seluruh internet, dan mengenali pola untuk menghasilkan informasi. Artinya mereka hanya bisa memberikan informasi tentang hal-hal yang terdokumentasi di internet. Sebaliknya, manusia mampu menggunakan penalaran. Kita menggunakan logika dan akal sehat untuk mencari makna di luar apa yang diungkapkan secara eksplisit.
Bhatia: Kita mempelajari kemampuan penalaran sejak lahir. Misalnya, kita tahu untuk tidak menyalakan blender pada jam 2 pagi karena akan membangunkan semua orang. Kami tidak diajarkan hal ini, tetapi itu adalah sesuatu yang Anda pahami berdasarkan situasi, lingkungan Anda, dan lingkungan sekitar Anda. Dalam waktu dekat, model AI akan menangani banyak tugas kita. Kami tidak dapat mengkodekan setiap aturan yang masuk akal ke dalam robot-robot ini, jadi kami ingin mereka memahami hal yang benar untuk dilakukan dalam konteks tertentu.
Shwartz: Menerapkan penalaran yang masuk akal pada model saat ini seperti ChatGPT akan membantu mereka memberikan jawaban yang lebih akurat sehingga menciptakan alat yang lebih canggih untuk digunakan manusia. Model AI saat ini telah menunjukkan beberapa bentuk penalaran yang masuk akal. Misalnya, jika Anda menanyakan ChatGPT versi terbaru tentang kue lumpur untuk anak-anak dan orang dewasa, ChatGPT dapat membedakan dengan tepat antara makanan penutup dan wajah penuh kotoran berdasarkan konteksnya.
Di manakah kegagalan model bahasa AI?
Shwartz: Penalaran yang masuk akal dalam model AI masih jauh dari sempurna. Kita hanya bisa mencapai kemajuan sejauh ini dengan melatih data dalam jumlah besar. Manusia masih perlu melakukan intervensi dan melatih model tersebut, termasuk dengan menyediakan data yang tepat.
Misalnya, kita mengetahui bahwa teks bahasa Inggris di web sebagian besar berasal dari Amerika Utara, sehingga model bahasa Inggris, yang paling umum digunakan, cenderung memiliki bias Amerika Utara dan berisiko tidak mengetahui konsep dari budaya lain atau untuk melanggengkan stereotip. Dalam makalah terbaru kami menemukan bahwa melatih model penalaran yang masuk akal berdasarkan data dari berbagai budaya, termasuk India, Nigeria, dan Korea Selatan, menghasilkan respons yang lebih akurat dan berdasarkan budaya.
Bhatia: Salah satu contohnya termasuk menunjukkan kepada model gambar seorang wanita di Somalia yang menerima tato henna dan menanyakan mengapa dia menginginkannya. Ketika dilatih dengan data budaya yang beragam, model tersebut dengan tepat menyatakan bahwa dia akan menikah, padahal sebelumnya model tersebut mengatakan bahwa dia ingin membeli pacar.
Shwartz: Kami juga menemukan contoh ChatGPT yang kurang memiliki kesadaran budaya. Ketika diberikan situasi hipotetis di mana pasangan memberi tip sebesar empat persen di sebuah restoran di Spanyol, model tersebut menyatakan bahwa mereka mungkin tidak puas dengan layanan tersebut. Hal ini mengasumsikan bahwa budaya memberi tip di Amerika Utara juga berlaku di Spanyol, padahal sebenarnya pemberian tip tidak umum dilakukan di negara tersebut dan tip sebesar empat persen kemungkinan besar berarti layanan yang luar biasa.
Mengapa kita perlu memastikan bahwa AI lebih inklusif?
Shwartz: Model bahasa ada dimana-mana. Jika model-model ini mengasumsikan serangkaian nilai dan norma yang diasosiasikan dengan budaya barat atau Amerika Utara, informasi yang ada pada dan tentang orang-orang dari budaya lain mungkin tidak akurat dan diskriminatif. Kekhawatiran lainnya adalah bahwa orang-orang dari berbagai latar belakang yang menggunakan produk yang didukung oleh model Inggris harus menyesuaikan masukan mereka dengan norma-norma Amerika Utara atau mereka mungkin akan mendapatkan kinerja yang kurang optimal.
Bhatia: Kami ingin alat ini dapat digunakan oleh semua orang di luar sana, bukan hanya satu kelompok orang. Kanada adalah negara yang memiliki beragam budaya dan kita perlu memastikan bahwa alat AI yang mendukung kehidupan kita tidak hanya mencerminkan satu budaya dan norma-normanya. Penelitian berkelanjutan kami bertujuan untuk mendorong inklusivitas, keragaman, dan kepekaan budaya dalam pengembangan dan penerapan teknologi AI.