Skip to content
INOVATIF, PROFESIONAL, DAN BERKEPRIBADIAN
facebook
youtube
instagram
Pusat Pengelolaan Digitalisasi Penjaminan Mutu Universitas Medan Area
Call Support 0823-6994-9970
Email Support [email protected]
Location Jl. Kolam No. 1 Medan Estate
  • BERANDA
  • TENTANG
    • PROFIL
    • VISI DAN MISI
    • STRUKTUR ORGANISASI
  • BERITA KEGIATAN
  • KERJASAMA
  • LAYANAN & INFORMASI
    • APLIKASI
      • PERPUSTAKAAN UMA
      • ACADEMIC ONLINE CAMPUS (AOC)
      • REPOSITORI UMA
      • TRACER STUDY (ALUMNI)
      • JURNAL
      • E-LEARNING UMA
      • DIREKTORI MAHASISWA
    • ARSIP
      • PERUBAHAN DATA MAHASISWA DI PDDIKTI
      • Buku Pedoman Universitas Medan Area
      • KURIKULUM
        • Kurikulum Teknik
        • Kurikulum Pertanian
        • Kurikulum Ekonomi dan Bisnis
        • Kurikulum Hukum
        • Kurikulum Isipol
        • Kurikulum Psikologi
        • Kurikulum Saintek
        • Kurikulum Agama Islam
      • Kalender Akademik Universitas Medan Area
      • Artikel
    • Helpdesk P2DIK
  • id
    • en
    • id

Penerapan Topic Modeling untuk Identifikasi Tren Diskusi di Media Sosial

Home > Artikel > Penerapan Topic Modeling untuk Identifikasi Tren Diskusi di Media Sosial

Penerapan Topic Modeling untuk Identifikasi Tren Diskusi di Media Sosial

Posted on 12 November 2025 by Anisa Rahma Nasution
0

Perkembangan teknologi informasi dan komunikasi yang pesat telah mendorong peningkatan penggunaan media sosial sebagai sarana utama dalam berinteraksi, berbagi informasi, dan menyampaikan opini publik. Platform seperti Twitter, Instagram, Facebook, dan Reddit kini menjadi ruang digital yang dinamis, di mana jutaan pengguna menghasilkan konten setiap harinya. Volume data yang besar, bersifat tidak terstruktur, dan terus berkembang menjadikan media sosial sebagai sumber informasi berharga untuk memahami perilaku serta pandangan masyarakat terhadap berbagai isu sosial, politik, ekonomi, dan budaya.

Namun, banyaknya data teks yang tersebar di media sosial menimbulkan tantangan dalam proses analisis. Analisis manual tidak lagi efisien karena memerlukan waktu dan sumber daya yang besar. Oleh karena itu, dibutuhkan pendekatan otomatis yang mampu mengolah dan mengekstraksi informasi bermakna dari data teks dalam jumlah besar. Salah satu metode yang dapat digunakan untuk tujuan tersebut adalah topic modeling, yaitu teknik dalam Natural Language Processing (NLP) yang digunakan untuk menemukan struktur tematik tersembunyi dalam kumpulan dokumen tanpa perlu label atau anotasi sebelumnya.

Melalui penerapan topic modeling, tema-tema atau topik utama yang sedang dibicarakan pengguna media sosial dapat diidentifikasi secara otomatis. Dengan demikian, teknik ini memungkinkan analisis tren diskusi publik dari waktu ke waktu, membantu memahami perubahan opini masyarakat, serta memberikan wawasan bagi pembuat kebijakan, pelaku bisnis, dan peneliti untuk merespons isu-isu yang sedang berkembang.

Sebagai contoh, penerapan topic modeling pada data Twitter dapat mengungkap topik-topik yang ramai diperbincangkan seputar pemilu, kebijakan pemerintah, bencana alam, atau tren teknologi tertentu. Selain itu, kombinasi antara analisis topik dan dimensi temporal dapat menunjukkan dinamika popularitas suatu topik dalam periode tertentu, sehingga dapat digunakan untuk mendeteksi tren, prediksi isu yang sedang naik daun, hingga mendukung pengambilan keputusan berbasis data.

Dengan latar belakang tersebut, penelitian mengenai penerapan topic modeling untuk identifikasi tren diskusi di media sosial menjadi penting untuk dikembangkan. Penelitian ini tidak hanya berkontribusi dalam pengembangan metode analisis teks otomatis, tetapi juga memberikan nilai praktis dalam memahami pola komunikasi publik di era digital yang semakin kompleks.

Tujuan Penelitian / Penerapan

  • Mengidentifikasi topik utama yang sedang dibicarakan di media sosial dalam periode tertentu.

  • Mengetahui tren diskusi (apa yang naik dan turun dari waktu ke waktu).

  • Membantu pembuat kebijakan, brand, atau peneliti memahami opini publik.

Metodologi Umum

Berikut alur umum penerapan topic modeling untuk media sosial:

a. Pengumpulan Data

  • Menggunakan API (misalnya Twitter API, Reddit API) atau web scraping.

  • Menentukan kata kunci atau hashtag tertentu (misalnya: #AI, #Pemilu2024).

b. Pra-pemrosesan Teks

  • Pembersihan data: hapus URL, mention, emoji, tanda baca.

  • Tokenisasi dan lemmatization/stemming.

  • Penghapusan stopwords (kata umum seperti “yang”, “dan”, “di”).

c. Representasi Teks

  • Mengubah teks menjadi representasi numerik, misalnya:

    • Bag-of-Words (BoW)

    • TF-IDF

    • Word Embedding (Word2Vec, FastText, BERT embeddings)

d. Pemodelan Topik

Beberapa metode umum:

Metode Deskripsi Singkat
LDA (Latent Dirichlet Allocation) Metode klasik yang paling populer untuk topik tidak berlabel.
NMF (Non-negative Matrix Factorization) Alternatif yang sering menghasilkan topik lebih koheren pada data pendek.
BERTopic Menggabungkan transformer embeddings + clustering (HDBSCAN) untuk hasil topik modern dan lebih semantik.

e. Analisis Tren

  • Melihat distribusi topik berdasarkan waktu (misal mingguan atau bulanan).

  • Visualisasi dengan line chart, word cloud, atau pyLDAvis.

Hasil yang Diharapkan

  • Daftar topik utama (misalnya: “kebijakan AI”, “keamanan data”, “etika teknologi”).

  • Visualisasi tren topik (kapan suatu topik meningkat atau menurun).

  • Interpretasi topik yang dapat digunakan untuk pengambilan keputusan strategis.

Tools yang Dapat Digunakan

  • Python libraries:

    • pandas, numpy (olah data)

    • nltk, spaCy, Sastrawi (pra-pemrosesan teks Bahasa Indonesia)

    • gensim (LDA, NMF)

    • BERTopic, sentence-transformers (topic modeling modern)

    • matplotlib, seaborn, plotly (visualisasi)

  • Platform tambahan:

    • Google Colab atau Jupyter Notebook untuk eksperimen

    • Power BI atau Tableau untuk dashboard tren topik

Contoh Studi Kasus

Misalnya:

“Analisis Tren Diskusi Publik tentang Pemilu 2024 di Twitter menggunakan Topic Modeling”

Langkahnya:

  1. Kumpulkan tweet dengan hashtag terkait.

  2. Terapkan LDA atau BERTopic.

  3. Hasilkan 5–10 topik utama (misal: kampanye calon, isu ekonomi, hoaks).

  4. Analisis evolusi topik per minggu.

Potensi Pengembangan

  • Integrasi sentiment analysis per topik.

  • Real-time trend tracking menggunakan streaming data.

  • Deteksi anomali topik (misalnya munculnya isu baru secara tiba-tiba).

Berikut contoh kode Python lengkap untuk penerapan topic modeling pada data media sosial (misalnya tweet dari Twitter) menggunakan metode BERTopic, salah satu pendekatan modern yang menghasilkan topik lebih koheren dan mudah diinterpretasikan:

Contoh Implementasi Topic Modeling di Media Sosial dengan BERTopic

1. Instalasi Library

Jalankan di awal (misalnya di Google Colab):

!pip install bertopic sentence-transformers nltk

2. Import Library dan Siapkan Data

Misalnya kita punya kumpulan tweet dalam file CSV atau daftar teks.

import pandas as pd
import nltk
from nltk.corpus import stopwords
from bertopic import BERTopic

# Unduh stopwords Bahasa Indonesia (kalau belum ada)
nltk.download(‘stopwords’)
stop_words = set(stopwords.words(‘indonesian’))

# Contoh data (bisa diganti dengan hasil scraping dari media sosial)
data = {
‘text’: [
“Pemerintah umumkan kebijakan baru untuk AI di Indonesia.”,
“Banyak pengguna Twitter bahas pemilu dan politik saat ini.”,
“Teknologi AI semakin canggih, tapi isu etika masih jadi perhatian.”,
“Ekonomi digital Indonesia terus tumbuh pesat berkat startup lokal.”,
“Masyarakat mulai khawatir dengan keamanan data pribadi mereka.”,
“Kebijakan baru tentang pendidikan teknologi diluncurkan minggu ini.”,
“AI membantu analisis data besar dan efisiensi industri.”,
“Banyak diskusi tentang dampak sosial media terhadap opini publik.”
]
}

df = pd.DataFrame(data)

3. Pra-pemrosesan Teks

Membersihkan teks dari tanda baca, emoji, dan stopwords sederhana.

import re

def clean_text(text):
text = text.lower()
text = re.sub(r”http\S+”, “”, text) # hapus URL
text = re.sub(r”[^a-zA-Z0-9\s]”, “”, text) # hapus tanda baca
text = ” “.join([word for word in text.split() if word not in stop_words])
return text

df[‘clean_text’] = df[‘text’].apply(clean_text)

4. Penerapan BERTopic

Gunakan model transformer untuk mendapatkan embedding dan melakukan clustering topik.

from sentence_transformers import SentenceTransformer

# Model embedding Bahasa Indonesia bisa diganti, misalnya “paraphrase-multilingual-MiniLM-L12-v2”
embedding_model = SentenceTransformer(“paraphrase-multilingual-MiniLM-L12-v2”)

# Inisialisasi dan fit BERTopic
topic_model = BERTopic(embedding_model=embedding_model, language=”indonesian”)
topics, probs = topic_model.fit_transform(df[‘clean_text’])

5. Hasil Identifikasi Topik

Lihat daftar topik yang ditemukan.

# Daftar topik dan kata kunci
topic_info = topic_model.get_topic_info()
print(topic_info)

6. Melihat Detail Tiap Topik

Tampilkan kata kunci untuk topik tertentu (misal topik 1).

# Menampilkan kata kunci topik tertentu
topic_model.get_topic(1)

7. Visualisasi Topik dan Tren

BERTopic punya visualisasi interaktif yang bagus (bisa dijalankan di notebook).

topic_model.visualize_topics()

Untuk tren waktu (jika datanya punya kolom waktu):

# Misalnya df[‘date’] berisi tanggal posting
# topic_model.visualize_topics_over_time(df[[‘clean_text’, ‘date’]])

8. Interpretasi Hasil

Misalnya hasil topik menunjukkan:

ID Topik Kata Kunci Utama
0 Kebijakan dan AI [‘kebijakan’, ‘ai’, ‘pemerintah’, ‘teknologi’]
1 Politik & Pemilu [‘pemilu’, ‘politik’, ‘twitter’, ‘bahas’]
2 Ekonomi Digital [‘ekonomi’, ‘startup’, ‘digital’, ‘indonesia’]

Dari sini kamu bisa melihat tren atau isu apa yang paling dominan dibicarakan di media sosial.

9. Opsional – Simpan Model & Topik

topic_model.save(“model_topic_media_sosial”)

Catatan:

  • Untuk data nyata dari media sosial, kamu bisa gunakan:

    • Twitter API v2 via tweepy atau snscrape untuk mengambil tweet.

    • Pastikan jumlah data minimal >500 teks agar topik yang dihasilkan lebih bermakna.

  • Jika datanya sangat besar, pertimbangkan LDA (Gensim) untuk performa lebih cepat, meski kualitas topiknya biasanya lebih rendah dibanding BERTopic.

Dalam era digital yang ditandai oleh pertumbuhan pesat media sosial, analisis terhadap konten yang dihasilkan pengguna menjadi semakin penting untuk memahami dinamika opini publik dan tren sosial yang berkembang. Melalui penerapan topic modeling, data teks yang tidak terstruktur dapat diolah menjadi informasi yang bermakna, memungkinkan identifikasi tema utama dan pola diskusi yang muncul di berbagai platform media sosial.

Penelitian atau penerapan ini menunjukkan bahwa metode seperti Latent Dirichlet Allocation (LDA) maupun BERTopic dapat secara efektif mengelompokkan teks berdasarkan kesamaan topik, serta membantu dalam pemetaan tren diskusi dari waktu ke waktu. Hasil analisis dapat dimanfaatkan oleh berbagai pihak — mulai dari peneliti, pembuat kebijakan, hingga pelaku industri — untuk memahami persepsi masyarakat, mendeteksi isu-isu yang sedang naik daun, serta mendukung pengambilan keputusan yang lebih tepat berbasis data.

Dengan demikian, penerapan topic modeling bukan hanya memberikan kontribusi dalam pengembangan teknik analisis teks otomatis, tetapi juga membuka peluang bagi riset lanjutan di bidang Natural Language Processing (NLP), analisis opini publik, dan pemantauan tren digital. Ke depannya, penggabungan dengan metode lain seperti sentiment analysis atau network analysis dapat memperkaya pemahaman terhadap dinamika percakapan online secara lebih komprehensif dan real-time.

Post Views: 390

p2dpm_uma

Jalan Kolam Nomor 1 Medan Estate

#PRESTASIDOSENUMA Selamat & Sukses Kepada 23 Dosen #PRESTASIDOSENUMA
Selamat & Sukses Kepada 23 Dosen Universitas Medan Area atas Penandatanganan Kontrak Program Penelitian & Pengabdian Kepada Masyarakat DPPM KEMDIKTISAINTEK Tahun Anggaran 2026
.
Informasi dan Pendaftaran Mahasiswa Baru :
➖➖➖➖➖➖➖
https://pmb.uma.ac.id
➖➖➖➖➖➖➖

Call Center UMA :
☎️0811 6013 888

#ptssehat #ptsterbaik #UMAkampusJuara #KampusUnggul
Get @reshare_app • @umabestari #REKORMURI Rektor U Get @reshare_app • @umabestari #REKORMURI
Rektor Universitas Medan Area Menjadi Salah Satu Pemateri Dalam Pemecahan Rekor MURI dalam Seminar 10 Pohon Ilmu dan Peserta Terbanyak yang di selenggarakan oleh Kantor LLDIKTI Wilayah I Sumut
.
Informasi dan Pendaftaran Mahasiswa Baru :
➖➖➖➖➖➖➖
https://pmb.uma.ac.id
➖➖➖➖➖➖➖

Call Center UMA :
☎️0811 6013 888

#ptssehat #PTSterbaik
#UMAkampusJuara #KampusUnggul
Get @reshare_app • @umabestari #KUNJUNGAN Kunjunga Get @reshare_app • @umabestari #KUNJUNGAN
Kunjungan Dr. dr. Delyuzar, M.Ked.(PA), Sp.PA(K), Ketua Umum Pengurus Wilayah (PW) Asosiasi Masjid Kampus
Indonesia (AMKI) Sumatera Utara ke Universitas Medan Area Dalam rangka melihat Pelaksanaan Pemotongan Hewan Qurban.
.
Informasi dan Pendaftaran Mahasiswa Baru :
➖➖➖➖➖➖➖
https://pmb.uma.ac.id
➖➖➖➖➖➖➖

Call Center UMA :
☎️0811 6013 888

#ptssehat #PTSterbaik
#UMAkampusJuara #KampusUnggul
Selamat Hari Raya Idul Adha 1447 H Selamat Hari Raya Idul Adha 1447 H
Yuk, buruan daftar sekarang! Yuk, buruan daftar sekarang!
Get @reshare_app • @umabestari #SOSIALISASI Dinas Get @reshare_app • @umabestari #SOSIALISASI
Dinas Pariwisata Medan dan Universitas Medan Area  berkolaborasi melaksanakan Sosialisasi Kompetisi Desain Logo HUT Kota Medan ke-436 Tahun 2026.
#PMBUMA2026 Yuk.. Join di Kampus Unggul Universi #PMBUMA2026 

Yuk.. Join di Kampus Unggul Universitas Medan Area. Dapatkan Beragam Fasilitas Pendidikan dan Beasiswa Hingga 100%. . 

Informasi dan Pendaftaran Mahasiswa Baru : 

➖➖➖➖➖➖➖
 https://pmb.uma.ac.id 
➖➖➖➖➖➖➖ 

Call Center UMA : 
☎️0811 6013 888 

#ptssehat #ptsterbaik #UMAkampusJuara
Get @reshare_app • @umabestari #JADWALUTSUMA Selam Get @reshare_app • @umabestari #JADWALUTSUMA
Selamat Melaksanakan Ujian Tengah Semester (UTS) Semester Genap Tahun Akademik 2025/2026 yang dilaksanakan tanggal 11 Mei s.d. 25 Mei 2026
.
Informasi dan Pendaftaran Mahasiswa Baru :
➖➖➖➖➖➖➖
https://pmb.uma.ac.id
➖➖➖➖➖➖➖

Call Center UMA :
☎️0811 6013 888

#ptssehat #ptsterbaik #UMAkampusJuara #KampusUnggul
Follow on Instagram

Lokasi P2DPM

url url url url url url url url url url url url

Kategori

  • Berita Terbaru
  • Pengumuman
  • Berita Kegiatan
  • Artikel

POSTINGAN TERPOPULER

  • Memahami Perbedaan Waktu: AM/PM, Zona Waktu, dan Sistem Jam
  • Cara Melihat IP Address di Semua Jenis Perangkat dan Jenis-Jenisnya
  • Dasar-Dasar Desain Grafis: Prinsip yang Harus Diketahui Pemula
  • Manfaat Pengelolaan Sumber Daya Alam Berkelanjutan Untuk Kehidupan
  • Pengertian Gelombang Longitudinal dan Contohnya dalam Kehidupan Sehari-Hari
KAMPUS 1
Jalan Kolam Nomor 1 Medan Estate / Jalan Gedung PBSI, Medan 20223
(061) 7360168, Call Canter : 0811-6013-888
[email protected]
KAMPUS 2
Jalan Sei Serayu Nomor 70 A / Jalan Setia Budi Nomor 79 B, Medan 20122
(061) 42402994, HP : 0811 607 259
[email protected]
© 2026 P2A2I - Universitas Medan Area