Skip to content
INOVATIF, PROFESIONAL, DAN BERKEPRIBADIAN
facebook
youtube
instagram
Pusat Pengelolaan Digitalisasi Penjaminan Mutu Universitas Medan Area
Call Support 0823-6994-9970
Email Support [email protected]
Location Jl. Kolam No. 1 Medan Estate
  • BERANDA
  • TENTANG
    • PROFIL
    • VISI DAN MISI
    • STRUKTUR ORGANISASI
  • BERITA KEGIATAN
  • KERJASAMA
  • LAYANAN & INFORMASI
    • APLIKASI
      • PERPUSTAKAAN UMA
      • ACADEMIC ONLINE CAMPUS (AOC)
      • REPOSITORI UMA
      • TRACER STUDY (ALUMNI)
      • JURNAL
      • E-LEARNING UMA
      • DIREKTORI MAHASISWA
    • ARSIP
      • PERUBAHAN DATA MAHASISWA DI PDDIKTI
      • Buku Pedoman Universitas Medan Area
      • KURIKULUM
        • Kurikulum Teknik
        • Kurikulum Pertanian
        • Kurikulum Ekonomi dan Bisnis
        • Kurikulum Hukum
        • Kurikulum Isipol
        • Kurikulum Psikologi
        • Kurikulum Saintek
        • Kurikulum Agama Islam
      • Kalender Akademik Universitas Medan Area
      • Artikel
    • Helpdesk P2DPM
  • id
    • en
    • id

Klasifikasi Berita Hoaks Menggunakan Natural Language Processing

Home > Artikel > Klasifikasi Berita Hoaks Menggunakan Natural Language Processing

Klasifikasi Berita Hoaks Menggunakan Natural Language Processing

Posted on 10 November 202510 November 2025 by Anisa Rahma Nasution
0

Perkembangan teknologi informasi dan komunikasi yang pesat telah membawa dampak signifikan terhadap cara manusia memperoleh dan menyebarkan informasi. Melalui berbagai platform digital seperti media sosial, portal berita daring, dan aplikasi pesan instan, informasi dapat tersebar dengan sangat cepat tanpa batas ruang dan waktu. Namun, kemudahan ini juga menimbulkan permasalahan baru, yaitu meningkatnya penyebaran berita palsu atau hoaks.

Berita hoaks merupakan informasi yang sengaja disebarluaskan dengan tujuan menyesatkan, memprovokasi, atau memengaruhi opini publik. Penyebaran berita hoaks dapat menimbulkan dampak negatif yang serius, seperti kepanikan masyarakat, konflik sosial, hingga penurunan kepercayaan terhadap media dan pemerintah. Oleh karena itu, diperlukan suatu sistem yang mampu mendeteksi dan mengklasifikasikan berita hoaks secara otomatis agar penyebaran informasi palsu dapat diminimalisasi.

Salah satu pendekatan yang dapat digunakan untuk mengatasi permasalahan ini adalah Natural Language Processing (NLP) atau pemrosesan bahasa alami. NLP merupakan cabang dari kecerdasan buatan (Artificial Intelligence) yang memungkinkan komputer untuk memahami, memproses, dan menganalisis teks dalam bahasa manusia. Melalui teknik NLP, teks berita dapat diolah menjadi representasi numerik yang kemudian diproses oleh algoritma machine learning atau deep learning untuk menentukan apakah suatu berita termasuk kategori hoaks atau bukan.

Dengan memanfaatkan NLP, proses deteksi berita hoaks dapat dilakukan secara lebih efisien, objektif, dan akurat dibandingkan dengan pemeriksaan manual oleh manusia. Selain itu, penelitian di bidang ini juga berpotensi memberikan kontribusi penting dalam meningkatkan literasi digital masyarakat dan membantu pemerintah maupun lembaga media dalam menangani penyebaran berita palsu di Indonesia.

Penyebaran berita hoaks di internet dan media sosial semakin marak, menimbulkan dampak negatif seperti disinformasi dan keresahan publik. Oleh karena itu, dibutuhkan sistem otomatis yang dapat mendeteksi dan mengklasifikasikan berita hoaks dengan cepat dan akurat.

Tujuan

  • Membangun model klasifikasi untuk membedakan berita hoaks vs. non-hoaks.

  • Menggunakan metode NLP untuk pembersihan data, representasi teks, dan pembelajaran mesin.

  • Mengevaluasi performa model dengan metrik seperti akurasi, presisi, recall, dan F1-score.

Tahapan Penelitian / Sistem

a. Pengumpulan Data

Kamu bisa menggunakan dataset seperti:

  • Fake News Dataset (Kaggle)

  • Indonesian Hoax News Dataset (dari Masyarakat Anti Fitnah Indonesia / MAFINDO)

  • Dataset buatan sendiri dari scraping portal berita.

b. Pra-pemrosesan Teks (Text Preprocessing)

Langkah-langkah umum:

  1. Case folding → ubah semua huruf menjadi huruf kecil.

  2. Tokenisasi → memecah teks menjadi kata-kata.

  3. Stopword removal → menghapus kata umum seperti “dan”, “yang”, “di”.

  4. Stemming / Lemmatization → mengembalikan kata ke bentuk dasarnya (“berlari” → “lari”).

  5. Cleaning → hapus tanda baca, angka, dan karakter non-alfabet.

Contoh (Python, pakai Sastrawi untuk Bahasa Indonesia):

from Sastrawi.Stemmer.StemmerFactory import StemmerFactory
factory = StemmerFactory()
stemmer = factory.create_stemmer()
stemmer.stem(“Pemerintah mengumumkan kebijakan baru terkait ekonomi nasional”)

c. Representasi Teks (Feature Extraction)

Beberapa metode umum:

  • Bag of Words (BoW)

  • TF-IDF (Term Frequency – Inverse Document Frequency)

  • Word Embeddings seperti:

    • Word2Vec

    • GloVe

    • FastText

    • BERT embeddings (misalnya IndoBERT)

d. Klasifikasi (Modeling)

Model yang umum digunakan:

  • Machine Learning klasik:

    • Naive Bayes

    • SVM

    • Logistic Regression

    • Random Forest

  • Deep Learning:

    • LSTM (Long Short-Term Memory)

    • CNN for Text

    • Transformer-based models (IndoBERT, BERT, RoBERTa)

Contoh model sederhana dengan TF-IDF + SVM:

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.svm import LinearSVC
from sklearn.pipeline import Pipeline

model = Pipeline([
(‘tfidf’, TfidfVectorizer(max_features=5000)),
(‘clf’, LinearSVC())
])

model.fit(X_train, y_train)
pred = model.predict(X_test)

e. Evaluasi Model

Gunakan metrik:

  • Accuracy

  • Precision

  • Recall

  • F1-Score

  • Confusion Matrix

from sklearn.metrics import classification_report
print(classification_report(y_test, pred))

Contoh Hasil dan Analisis

Misalnya hasil evaluasi menunjukkan:

Model Accuracy Precision Recall F1-Score
Naive Bayes 85% 84% 83% 83.5%
SVM 90% 89% 90% 89.5%
IndoBERT 94% 94% 93% 93.5%

Kesimpulan

Maka bisa disimpulkan bahwa IndoBERT memberikan hasil terbaik karena dapat memahami konteks bahasa Indonesia lebih dalam. Penelitian mengenai klasifikasi berita hoaks menggunakan Natural Language Processing (NLP) menunjukkan bahwa pemanfaatan teknologi kecerdasan buatan mampu memberikan solusi efektif dalam mendeteksi dan memfilter informasi palsu yang beredar di media digital. Melalui tahapan pra-pemrosesan teks, ekstraksi fitur, serta penerapan algoritma klasifikasi seperti Support Vector Machine (SVM), Naive Bayes, atau model berbasis deep learning seperti IndoBERT, sistem mampu membedakan antara berita hoaks dan non-hoaks dengan tingkat akurasi yang cukup tinggi.

Hasil ini membuktikan bahwa penerapan NLP tidak hanya berperan penting dalam analisis teks, tetapi juga dapat menjadi alat bantu dalam menjaga kualitas informasi di ruang publik. Dengan demikian, teknologi ini berpotensi besar untuk diimplementasikan dalam sistem deteksi otomatis berita hoaks di berbagai platform media daring.

Saran

Untuk pengembangan lebih lanjut, penelitian ini dapat diperluas dengan beberapa pendekatan berikut:

  1. Menambah variasi dan ukuran dataset, agar model mampu belajar dari beragam gaya bahasa dan topik berita.

  2. Menggunakan pendekatan multi-modal, misalnya dengan menggabungkan analisis teks, gambar, dan sumber berita untuk hasil deteksi yang lebih akurat.

  3. Menerapkan model Transformer terbaru atau large language model (LLM) untuk memahami konteks berita secara lebih mendalam.

  4. Membangun sistem aplikasi berbasis web atau mobile, sehingga hasil klasifikasi dapat dimanfaatkan langsung oleh masyarakat atau lembaga pemeriksa fakta.

Dengan adanya penelitian dan pengembangan berkelanjutan dalam bidang ini, diharapkan teknologi NLP dapat menjadi salah satu solusi efektif dalam memerangi penyebaran berita hoaks dan mendukung terciptanya ekosistem informasi yang lebih sehat dan terpercaya di Indonesia.

Post Views: 335

p2dpm_uma

Jalan Kolam Nomor 1 Medan Estate

Get @reshare_app • @umabestari #UTBKSNBT Semoga Su Get @reshare_app • @umabestari #UTBKSNBT
Semoga Sukses Peserta Seleksi UTBK - SNBT Ujian Masuk Perguruan Tinggi Negeri USU & Unimed Tahun Seleksi 2026 di Kampus I & II Universitas Medan Area.
.
Informasi dan Pendaftaran Mahasiswa Baru :
➖➖➖➖➖➖➖
https://pmb.uma.ac.id
➖➖➖➖➖➖➖

Call Center UMA :
☎️0811 6013 888

#ptssehat #PTSterbaik #UMAkampusJuara #KampusUnggul
#UMAFAIR2026 Wakil Rektor Bidang Kemahasiswaan, In #UMAFAIR2026 Wakil Rektor Bidang Kemahasiswaan, Inovasi dan Alumni Resmi Membuka Acara UMA FAIR 2026 . 

Informasi dan Pendaftaran Mahasiswa Baru : 

➖➖➖➖➖➖➖ 
https://pmb.uma.ac.id 
➖➖➖➖➖➖➖ 

Call Center UMA : 
☎️0811 6013 888 

#ptssehat #PTSterbaik #UMAkampusJuara #KampusUnggul
🌼 Selamat memperingati Hari Kartini 🌼 Jangan perna 🌼 Selamat memperingati Hari Kartini 🌼
Jangan pernah ragu untuk bersuara, menunjukkan kemampuan, dan memperjuangkan apa yg kamu yakini benar.
Get @reshare_app • @umabestari #PRESTASIUMA Alhamd Get @reshare_app • @umabestari #PRESTASIUMA
Alhamdulillan, Selamat dan Sukses Kepada Univeristas Medan Area Meraih Prestasi 9 Penghargaan Pada Anugerah Kementerian Pendidikan Tinggi, Sains dan Teknologi Lembaga Layanan Pendidikan Tinggi Wilayah I Tahun 2025.
.
Informasi dan Pendaftaran Mahasiswa Baru :
➖➖➖➖➖➖➖
https://pmb.uma.ac.id
➖➖➖➖➖➖➖

Call Center UMA :
☎️0811 6013 888

#ptssehat #ptsterbaik #UMAkampusJuara #KampusUnggul
#PMBUMA2026 Bingung Kuliah Dimana? Kuliah di UMA #PMBUMA2026 
Bingung Kuliah Dimana? Kuliah di UMA aja ! Banyak Fasilitas Beasiswanya loh! . 

Informasi dan Pendaftaran Mahasiswa Baru : 

➖➖➖➖➖➖➖
https://pmb.uma.ac.id
➖➖➖➖➖➖➖ 

Call Center UMA : 
☎️0811 6013 888 

#ptsfavorite #PTSterbaik #UMAkampusJuara #KampusUnggul
Get @reshare_app • @umabestari #PRESTASIMAHASISWA Get @reshare_app • @umabestari #PRESTASIMAHASISWA
Selamat & Sukses Kepada 
Juara 1 : Allisha Az Zahro 
Juara 2 : Rizky Abdillah
Juara 3: Desy Angelina
Pada Pemilihan Mahasiswa Berprestasi (PILMAPRES) Tingkat Universitas Medan Area Tahun 2025.
.
Informasi dan Pendaftaran Mahasiswa Baru :
➖➖➖➖➖➖➖
https://pmb.uma.ac.id
➖➖➖➖➖➖➖

Call Center UMA :
☎️0811 6013 888

#ptssehat #ptsterbaik #UMAkampusJuara #KampusUnggul
Get @reshare_app • @umabestari #KERJASAMA Universi Get @reshare_app • @umabestari #KERJASAMA
Universitas Medan Area melaksanakan Penanda Tanganan Kerjasama Dengan Pemerintah Kabupaten Deli Serdang 
.
Informasi dan Pendaftaran Mahasiswa Baru :
➖➖➖➖➖➖➖
https://pmb.uma.ac.id
➖➖➖➖➖➖➖

Call Center UMA :
☎️0811 6013 888

#ptssehat #ptsterbaik #UMAkampusJuara #KampusUnggul
Pengumuman Libur Hari Raya Idul Fitri 1447 H Pengumuman Libur Hari Raya Idul Fitri 1447 H
Follow on Instagram

Lokasi P2DPM

url url url url url url url url url url url url

Kategori

  • Berita Terbaru
  • Pengumuman
  • Berita Kegiatan
  • Artikel

POSTINGAN TERPOPULER

  • Cara Melihat IP Address di Semua Jenis Perangkat dan Jenis-Jenisnya
  • Memahami Perbedaan Waktu: AM/PM, Zona Waktu, dan Sistem Jam
  • Dasar-Dasar Desain Grafis: Prinsip yang Harus Diketahui Pemula
  • Manfaat Pengelolaan Sumber Daya Alam Berkelanjutan Untuk Kehidupan
  • Pengertian Gelombang Longitudinal dan Contohnya dalam Kehidupan Sehari-Hari
KAMPUS 1
Jalan Kolam Nomor 1 Medan Estate / Jalan Gedung PBSI, Medan 20223
(061) 7360168, Call Canter : 0811-6013-888
[email protected]
KAMPUS 2
Jalan Sei Serayu Nomor 70 A / Jalan Setia Budi Nomor 79 B, Medan 20122
(061) 42402994, HP : 0811 607 259
[email protected]

STATISTIK

  • 1
  • 80
  • 64
  • 361,252
  • 257,007
© 2026 PDAI - Universitas Medan Area