Skip to content
INOVATIF, PROFESIONAL, DAN BERKEPRIBADIAN
facebook
youtube
instagram
Pusat Pengelolaan Digitalisasi Penjaminan Mutu Universitas Medan Area
Call Support 0823-6994-9970
Email Support [email protected]
Location Jl. Kolam No. 1 Medan Estate
  • BERANDA
  • TENTANG
    • PROFIL
    • VISI DAN MISI
    • STRUKTUR ORGANISASI
  • BERITA KEGIATAN
  • KERJASAMA
  • LAYANAN & INFORMASI
    • APLIKASI
      • PERPUSTAKAAN UMA
      • ACADEMIC ONLINE CAMPUS (AOC)
      • REPOSITORI UMA
      • TRACER STUDY (ALUMNI)
      • JURNAL
      • E-LEARNING UMA
      • DIREKTORI MAHASISWA
    • ARSIP
      • PERUBAHAN DATA MAHASISWA DI PDDIKTI
      • Buku Pedoman Universitas Medan Area
      • KURIKULUM
        • Kurikulum Teknik
        • Kurikulum Pertanian
        • Kurikulum Ekonomi dan Bisnis
        • Kurikulum Hukum
        • Kurikulum Isipol
        • Kurikulum Psikologi
        • Kurikulum Saintek
        • Kurikulum Agama Islam
      • Kalender Akademik Universitas Medan Area
      • Artikel
    • Helpdesk P2DPM
  • id
    • en
    • id

Deteksi Spam pada Email Menggunakan Natural Language Processing

Home > Artikel > Deteksi Spam pada Email Menggunakan Natural Language Processing

Deteksi Spam pada Email Menggunakan Natural Language Processing

Posted on 28 Oktober 202528 Oktober 2025 by Anisa Rahma Nasution
0

Perkembangan teknologi informasi yang pesat telah menjadikan email sebagai salah satu sarana komunikasi utama dalam kehidupan sehari-hari, baik untuk keperluan pribadi maupun profesional. Melalui email, pengguna dapat bertukar informasi dengan cepat, efisien, dan murah. Namun, di balik kemudahan tersebut, muncul permasalahan serius berupa spam, yaitu pesan elektronik yang dikirim secara massal tanpa seizin penerima dan sering kali berisi iklan, promosi tidak relevan, atau bahkan upaya penipuan (phishing).

Spam tidak hanya mengganggu kenyamanan pengguna, tetapi juga dapat menimbulkan risiko keamanan seperti pencurian data pribadi, penyebaran malware, dan penurunan produktivitas akibat waktu yang terbuang untuk memilah pesan yang sah dan tidak sah. Oleh karena itu, diperlukan sistem yang mampu mendeteksi dan memfilter email spam secara otomatis agar pesan yang diterima pengguna lebih aman dan relevan.

Salah satu pendekatan yang efektif untuk mengatasi permasalahan ini adalah dengan menggunakan Natural Language Processing (NLP), yaitu cabang dari kecerdasan buatan yang berfokus pada pemrosesan dan pemahaman bahasa alami oleh komputer. Melalui NLP, isi dari pesan email dapat dianalisis untuk mengenali pola atau ciri khas yang membedakan antara email spam dan non-spam (ham).

Dengan memanfaatkan algoritma Machine Learning, sistem dapat dilatih menggunakan dataset berisi contoh email spam dan non-spam untuk kemudian mampu melakukan klasifikasi secara otomatis pada email baru. Metode ini terbukti efisien karena mampu beradaptasi terhadap perubahan pola bahasa yang digunakan oleh pengirim spam.

Berdasarkan uraian tersebut, penelitian atau proyek dengan judul “Deteksi Spam pada Email Menggunakan Natural Language Processing” bertujuan untuk membangun sistem cerdas yang dapat mengidentifikasi dan memfilter email spam secara akurat. Sistem ini diharapkan dapat membantu meningkatkan keamanan, efisiensi, dan kenyamanan pengguna dalam berkomunikasi melalui email.

2. Tujuan

  • Membangun sistem deteksi spam pada email yang mampu membedakan antara pesan spam dan pesan non-spam (ham) secara otomatis menggunakan metode Natural Language Processing (NLP).

  • Menerapkan tahapan preprocessing teks seperti tokenisasi, stopword removal, dan stemming untuk membersihkan serta menyiapkan data teks agar siap digunakan dalam proses klasifikasi.

  • Mengekstraksi fitur teks menggunakan metode TF-IDF (Term Frequency–Inverse Document Frequency) atau teknik representasi teks lainnya agar sistem dapat mengenali pola bahasa yang digunakan dalam email.

  • Menerapkan dan membandingkan algoritma Machine Learning seperti Naive Bayes, Logistic Regression, atau SVM untuk menentukan model terbaik dalam mendeteksi email spam.

  • Mengevaluasi kinerja sistem deteksi spam menggunakan metrik seperti akurasi, presisi, recall, dan F1-score untuk mengetahui sejauh mana sistem mampu mengklasifikasikan email secara tepat.

  • Meningkatkan keamanan dan efisiensi komunikasi email dengan meminimalkan jumlah pesan spam yang diterima oleh pengguna.

3. Dataset

Beberapa dataset populer:

  • SpamAssassin Public Corpus

  • Enron Email Dataset

  • Kaggle: SMS Spam Collection Dataset
    (meskipun berbentuk SMS, sering digunakan untuk eksperimen serupa)

Format umum dataset:

| Label | Text |
|--------|--------------------------------------|
| spam | Congratulations! You've won $1000! |
| ham | Hi John, let'
s meet tomorrow. |

4. Tahapan Implementasi

a. Preprocessing Teks

Langkah-langkah utama:

  1. Case folding – ubah semua huruf ke huruf kecil.

  2. Tokenization – memecah teks menjadi kata-kata.

  3. Stopword removal – hilangkan kata umum seperti “the”, “and”, “is”.

  4. Stemming/Lemmatization – ubah kata ke bentuk dasarnya.

  5. Cleaning – hapus angka, tanda baca, dan simbol.

Contoh Python (menggunakan nltk atau scikit-learn):

import re
from nltk.corpus import stopwords
from nltk.stem import PorterStemmer
ps = PorterStemmer()
stop_words = set(stopwords.words(‘english’))def preprocess(text):
text = text.lower()
text = re.sub(r'[^a-z]’, ‘ ‘, text)
tokens = text.split()
tokens = [ps.stem(w) for w in tokens if w not in stop_words]
return ‘ ‘.join(tokens)

b. Feature Extraction

Konversi teks menjadi angka agar bisa diproses oleh model ML:

  • Bag of Words (BoW)

  • TF-IDF (Term Frequency–Inverse Document Frequency)

  • Word Embedding (Word2Vec, GloVe, BERT, dsb)

Contoh TF-IDF:

from sklearn.feature_extraction.text import TfidfVectorizer

vectorizer = TfidfVectorizer(max_features=3000)
X = vectorizer.fit_transform(corpus).toarray()

c. Model Machine Learning

Beberapa model umum untuk klasifikasi teks:

  • Naive Bayes (paling populer dan efisien untuk spam detection)

  • Logistic Regression

  • Support Vector Machine (SVM)

  • Random Forest

  • Deep Learning (LSTM, BERT) untuk pendekatan lanjutan

Contoh Naive Bayes:

from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import accuracy_score, classification_report
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
model = MultinomialNB()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)print(“Accuracy:”, accuracy_score(y_test, y_pred))
print(classification_report(y_test, y_pred))

5. Evaluasi Model

Gunakan metrik:

  • Accuracy

  • Precision

  • Recall

  • F1-score

  • Confusion Matrix

Contoh:

precision recall f1-score support

ham 0.98 0.97 0.98 965
spam 0.93 0.96 0.94 150

accuracy 0.97 1115

Berdasarkan hasil penelitian dan implementasi sistem deteksi spam pada email menggunakan metode Natural Language Processing (NLP) dan Machine Learning, dapat disimpulkan bahwa:

  1. NLP mampu memproses dan mengekstraksi informasi penting dari teks email, sehingga sistem dapat mengenali pola kata atau kalimat yang umum muncul pada pesan spam maupun pesan non-spam (ham).

  2. Proses preprocessing teks seperti tokenisasi, stopword removal, dan stemming sangat berpengaruh terhadap hasil klasifikasi, karena langkah-langkah tersebut membantu mengurangi noise dan meningkatkan kualitas fitur yang dihasilkan.

  3. Model Machine Learning, khususnya Multinomial Naive Bayes dengan pendekatan TF-IDF, terbukti memberikan hasil yang akurat dan efisien dalam mendeteksi spam. Model ini memiliki keunggulan dalam menangani data teks dengan dimensi besar dan distribusi kata yang beragam.

  4. Berdasarkan hasil pengujian, sistem yang dibangun mampu mencapai tingkat akurasi yang tinggi (misalnya di atas 90%), yang menunjukkan bahwa pendekatan NLP efektif dalam mengidentifikasi email spam secara otomatis.

  5. Dengan penerapan sistem ini, pengguna dapat lebih mudah memfilter email yang masuk sehingga waktu dan keamanan dalam berkomunikasi melalui email dapat lebih terjamin.

Sebagai tindak lanjut, penelitian ini dapat dikembangkan lebih lanjut dengan menggunakan teknik deep learning seperti LSTM atau BERT untuk meningkatkan pemahaman konteks bahasa dan akurasi klasifikasi, serta integrasi dengan sistem keamanan email secara real-time.

Post Views: 478

p2dpm_uma

Jalan Kolam Nomor 1 Medan Estate

Get @reshare_app • @umabestari #UTBKSNBT Semoga Su Get @reshare_app • @umabestari #UTBKSNBT
Semoga Sukses Peserta Seleksi UTBK - SNBT Ujian Masuk Perguruan Tinggi Negeri USU & Unimed Tahun Seleksi 2026 di Kampus I & II Universitas Medan Area.
.
Informasi dan Pendaftaran Mahasiswa Baru :
➖➖➖➖➖➖➖
https://pmb.uma.ac.id
➖➖➖➖➖➖➖

Call Center UMA :
☎️0811 6013 888

#ptssehat #PTSterbaik #UMAkampusJuara #KampusUnggul
#UMAFAIR2026 Wakil Rektor Bidang Kemahasiswaan, In #UMAFAIR2026 Wakil Rektor Bidang Kemahasiswaan, Inovasi dan Alumni Resmi Membuka Acara UMA FAIR 2026 . 

Informasi dan Pendaftaran Mahasiswa Baru : 

➖➖➖➖➖➖➖ 
https://pmb.uma.ac.id 
➖➖➖➖➖➖➖ 

Call Center UMA : 
☎️0811 6013 888 

#ptssehat #PTSterbaik #UMAkampusJuara #KampusUnggul
🌼 Selamat memperingati Hari Kartini 🌼 Jangan perna 🌼 Selamat memperingati Hari Kartini 🌼
Jangan pernah ragu untuk bersuara, menunjukkan kemampuan, dan memperjuangkan apa yg kamu yakini benar.
Get @reshare_app • @umabestari #PRESTASIUMA Alhamd Get @reshare_app • @umabestari #PRESTASIUMA
Alhamdulillan, Selamat dan Sukses Kepada Univeristas Medan Area Meraih Prestasi 9 Penghargaan Pada Anugerah Kementerian Pendidikan Tinggi, Sains dan Teknologi Lembaga Layanan Pendidikan Tinggi Wilayah I Tahun 2025.
.
Informasi dan Pendaftaran Mahasiswa Baru :
➖➖➖➖➖➖➖
https://pmb.uma.ac.id
➖➖➖➖➖➖➖

Call Center UMA :
☎️0811 6013 888

#ptssehat #ptsterbaik #UMAkampusJuara #KampusUnggul
#PMBUMA2026 Bingung Kuliah Dimana? Kuliah di UMA #PMBUMA2026 
Bingung Kuliah Dimana? Kuliah di UMA aja ! Banyak Fasilitas Beasiswanya loh! . 

Informasi dan Pendaftaran Mahasiswa Baru : 

➖➖➖➖➖➖➖
https://pmb.uma.ac.id
➖➖➖➖➖➖➖ 

Call Center UMA : 
☎️0811 6013 888 

#ptsfavorite #PTSterbaik #UMAkampusJuara #KampusUnggul
Get @reshare_app • @umabestari #PRESTASIMAHASISWA Get @reshare_app • @umabestari #PRESTASIMAHASISWA
Selamat & Sukses Kepada 
Juara 1 : Allisha Az Zahro 
Juara 2 : Rizky Abdillah
Juara 3: Desy Angelina
Pada Pemilihan Mahasiswa Berprestasi (PILMAPRES) Tingkat Universitas Medan Area Tahun 2025.
.
Informasi dan Pendaftaran Mahasiswa Baru :
➖➖➖➖➖➖➖
https://pmb.uma.ac.id
➖➖➖➖➖➖➖

Call Center UMA :
☎️0811 6013 888

#ptssehat #ptsterbaik #UMAkampusJuara #KampusUnggul
Get @reshare_app • @umabestari #KERJASAMA Universi Get @reshare_app • @umabestari #KERJASAMA
Universitas Medan Area melaksanakan Penanda Tanganan Kerjasama Dengan Pemerintah Kabupaten Deli Serdang 
.
Informasi dan Pendaftaran Mahasiswa Baru :
➖➖➖➖➖➖➖
https://pmb.uma.ac.id
➖➖➖➖➖➖➖

Call Center UMA :
☎️0811 6013 888

#ptssehat #ptsterbaik #UMAkampusJuara #KampusUnggul
Pengumuman Libur Hari Raya Idul Fitri 1447 H Pengumuman Libur Hari Raya Idul Fitri 1447 H
Follow on Instagram

Lokasi P2DPM

url url url url url url url url url url url url

Kategori

  • Berita Terbaru
  • Pengumuman
  • Berita Kegiatan
  • Artikel

POSTINGAN TERPOPULER

  • Cara Melihat IP Address di Semua Jenis Perangkat dan Jenis-Jenisnya
  • Memahami Perbedaan Waktu: AM/PM, Zona Waktu, dan Sistem Jam
  • Dasar-Dasar Desain Grafis: Prinsip yang Harus Diketahui Pemula
  • Manfaat Pengelolaan Sumber Daya Alam Berkelanjutan Untuk Kehidupan
  • Pengertian Gelombang Longitudinal dan Contohnya dalam Kehidupan Sehari-Hari
KAMPUS 1
Jalan Kolam Nomor 1 Medan Estate / Jalan Gedung PBSI, Medan 20223
(061) 7360168, Call Canter : 0811-6013-888
[email protected]
KAMPUS 2
Jalan Sei Serayu Nomor 70 A / Jalan Setia Budi Nomor 79 B, Medan 20122
(061) 42402994, HP : 0811 607 259
[email protected]

STATISTIK

  • 5
  • 719
  • 603
  • 359,405
  • 255,519
© 2026 PDAI - Universitas Medan Area