Peneliti dari Fakultas Ilmu Komputer Universitas Indonesia (Fasilkom UI), yaitu Muhammad Okky Ibrohim MKom dan Dr Indra Budi memanfaatkan kecerdasan buatan (artificial intelligence/AI) untuk mendeteksi ujaran kebencian dan bahasa kasar yang dicuitkan oleh warganet (netizen) Indonesia pada media sosial Twitter. Penelitian ini kelak dapat dimanfaatkan oleh Direktorat Tindak Pidana Siber Bareskrim Polri untuk investigasi kejahatan siber di Indonesia.

Hasil riset menunjukkan bahwa kombinasi fitur Word Unigram, Random Forest Decision Tree (RFDT), dan Label Power-set (LP) mampu mendeteksi bahasa kasar dan ujaran kebencian yang terdapat di Twitter dengan akurasi 77,36 persen. Dari total 13.169 cuitan yang berhasil dikumpulkan dengan memanfaatkan Twitter Search API, tercatat sebanyak 7.608 cuitan adalah bukan ujaran kebencian, dan 5.561 cuitan adalah ujaran kebencian.

Menurut Okky, dalam risetnya ini, ujaran kebencian dibagi menjadi lima kategori, seperti agama, ras, fisik, gender atau orientasi seksual, dan umpatan lainnya. Pendeteksian juga mampu mengklasifikasikan target, kategori, dan level ujaran kebencian itu sendiri.

Ujaran kebencian diklasifikasikan pada tiga level. Pertama, weak hate speech yaitu level kata umpatan ditujukan pada individu tanpa unsur provokasi. Kedua, moderate hate speech adalah level umpatan yang ditujukan kepada kelompok tanpa provokasi. Ketiga, strong hate speech adalah level umpatan yang memprovokasi dan berpotensi membuka konflik.

Okky menjelaskan, penelitian ini berangkat dari maraknya ujaran kebencian dan penggunaan bahasa yang kasar pada media sosial, khususnya Twitter, yang sangat berpotensi menimbulkan konflik antar-individu maupun kelompok. Tidak jarang pula, ujaran kebencian dengan menggunakan bahasa kasar dipakai untuk menyerang seseorang maupun kelompok.

“Saat ini, kami terus berupaya mengembangkan pemanfaatan AI untuk deteksi hate speech. Kami berharap, adanya alat bantu teknologi akan semakin mempermudah tim melakukan investigasi kejahatan siber,” jelas Okky.

Dalam penelitiannya, lanjut Okky, baik definisi yang digunakan maupun panduan anotasi, disusun berdasarkan buku bahasa sosial dan handbook ujaran kebencian, serta divalidasi oleh ahli dengan wawancara dan diskusi kelompok bersama staf Direktorat Tindak Pidana Siber Badan Reserse dan Kriminal Polri (Bareskrim Polri), serta seorang linguis. Hal ini dilakukan untuk memvalidasi definisi ujaran kebencian secara tepat.