Keterbatasan Reasoning LLM dan VLM dalam Memahami Budaya Lokal

Fakultas Ilmu Komputer Universitas Indonesia > Campus News > Keterbatasan Reasoning LLM dan VLM dalam Memahami Budaya Lokal

Depok, 10 April 2026 — Fakultas Ilmu Komputer Universitas Indonesia (Fasilkom UI) menyelenggarakan kuliah umum bertajuk “Keterbatasan Reasoning LLM dan VLM dalam Memahami Budaya Lokal” yang menghadirkan Fajri Koto, S.Kom., M.Kom., Ph.D. sebagai pembicara. Dr. Fajri merupakan Assistant Professor di bidang Natural Language Processing (NLP) di Mohamed bin Zayed University of Artificial Intelligence (MBZUAI) dan juga Alumni Fasilkom UI, dengan fokus riset pada human-centered NLP, termasuk penyelarasan budaya pada Large Language Models (LLMs), serta aspek keamanan dan keadilan dalam generative AI

Kegiatan ini dimoderatori oleh Prof. Dr. Indra Budi, S.Kom., M.Kom., selaku Kepala Program Studi Magister dan Doktor Ilmu Komputer Fasilkom UI, serta diikuti oleh civitas academica termasuk dosen dan mahasiswa Fasilkom UI secara luring maupun daring melalui platform Zoom.

Kegiatan ini mengangkat isu penting terkait perkembangan LLMs dan Vision-Language Models (VLMs) yang meskipun memiliki kemampuan generalisasi yang kuat, masih menghadapi tantangan dalam memahami konteks budaya lokal. Hal ini disebabkan oleh dominasi data berbahasa Inggris dan Eropa dalam proses pengembangannya, yang berpotensi menghasilkan berbagai bias, seperti bias budaya, gender, dan ekonomi.

Dalam pemaparannya, Dr. Fajri menjelaskan pentingnya pengembangan dataset berbasis budaya lokal sebagai upaya untuk mengevaluasi sejauh mana model dapat memahami konteks masyarakat tertentu. Salah satu pendekatan yang diperkenalkan adalah Cultural Common Sense Reasoning, yaitu metode untuk menguji kemampuan model dalam memahami kebiasaan dan pengetahuan umum yang spesifik pada suatu budaya. Dataset yang dikembangkan menggunakan konteks geografis Indonesia dan disusun dalam format pilihan ganda guna mengukur tingkat pemahaman model secara lebih terstruktur. Dipaparkan bahwa performa model dapat meningkat secara signifikan ketika diberikan konteks lokasi yang lebih spesifik.

Kuliah ini juga membahas hasil penelitian terkait penggunaan model seperti GPT-4 dalam memahami teks prosedural dan pengetahuan berbasis budaya. Meskipun model menunjukkan performa yang cukup tinggi, masih ditemukan kesulitan dalam memahami langkah-langkah tertentu, terutama yang bersifat negatif atau tidak eksplisit. Temuan lain yang cukup menarik menunjukkan bahwa penggunaan bahasa Inggris dalam beberapa kasus justru menghasilkan performa yang lebih baik dibandingkan bahasa lokal, meskipun konteks yang dibahas berkaitan dengan budaya non-Barat.

Dalam aspek optimasi, Dr. Fajri turut menjelaskan metode seperti Direct Preference Optimization (DPO) dan pendekatan iteratif lainnya untuk meningkatkan kemampuan model dalam memahami konteks lintas budaya. Metode ini terbukti mampu meningkatkan performa model secara signifikan, bahkan dengan jumlah data yang relatif kecil. Selain itu, dibahas pula kerentanan model VLM terhadap pengecoh atau gangguan pada konteks visual budaya, yang dapat menyebabkan penurunan akurasi secara drastis seperti penambahan bendera atau latar tempat yang tidak sesuai dengan budaya atau makanan.

Melalui kegiatan ini, diharapkan dapat mendorong pengembangan teknologi kecerdasan buatan yang lebih inklusif, adaptif, dan mampu memahami keberagaman budaya, khususnya di Indonesia.