Loading Events

Deskripsi Topik:
Seiring berkembangnya Large Language Models (LLMs) dari sekadar penghasil teks menjadi sistem yang mampu menangani complex reasoning, konteks multibahasa, hingga perencanaan jangka panjang, metode evaluasi yang digunakan juga perlu berevolusi. Pendekatan konvensional seperti downstream tasks, metrik n-gram, dan benchmark pilihan ganda dinilai tidak lagi cukup untuk mengukur kemampuan model secara komprehensif.

Sesi ini akan membahas perkembangan metodologi evaluasi LLM, termasuk keterbatasan dari berbagai pendekatan yang ada saat ini. Selain itu, akan dibahas pula bias struktural baik dalam penilaian otomatis maupun evaluasi berbasis manusia, serta pentingnya pergeseran menuju kerangka evaluasi yang lebih dinamis dan mendalam guna memahami kemampuan AI secara lebih akurat.

Profil Singkat Pemateri:
Alham Fikri Aji, Ph.D. merupakan peneliti di bidang Natural Language Processing (NLP) yang berfokus pada efisiensi model melalui compression dan distillation, serta pengembangan NLP untuk bahasa dengan sumber daya terbatas.

Ia aktif dalam pengembangan dataset, data-efficient learning, pendekatan zero-shot, serta pembangunan model multibahasa, khususnya untuk kawasan Asia Tenggara. Saat ini, ia juga terlibat aktif dalam komunitas riset NLP Indonesia, termasuk sebagai salah satu inisiator gerakan IndoNLP.

Sebelumnya, ia merupakan applied research scientist di Amazon dan postdoctoral fellow di The University of Edinburgh. Ia juga pernah berkontribusi dalam pengembangan proyek Neural Machine Translation seperti Marian. Selain itu, ia memiliki pengalaman di berbagai perusahaan teknologi seperti Apple dan Google.

Mari bergabung dan menimba ilmu bersama dalam kuliah umum yang akan dilaksanakan secara hibrida pada:

📅 Hari & Tanggal: Selasa, 21 April 2026
⏰ Waktu: 13:0 WIB
📍 Tempat:
Luring (Offline): Ruang Sidang Lt. 4, Gedung Baru Fasilkom UI (Terbatas untuk 40 pendaftar pertama)

Daring (Online): Melalui Zoom Meeting

📝 Link Registrasi:
https://cs.ui.ac.id/daftarKuliahLLM

Siapkan catatan dan pertanyaan terbaik Anda untuk berdiskusi langsung mengenai perkembangan evaluasi AI dan masa depan sistem yang lebih selaras dengan manusia. Sampai jumpa!

Details

Organizer

  • Faculty of Computer Science, UI

Venue

  • Auditorium Indro Suwandi