PERBANDINGAN KUALITAS PENGENALAN SUARA UNTUK EKSTRAKSI FITUR MENGGUNAKAN MFCC DAN SPECTRAL

  • Ricky Aurelius Nurtanto Diaz Institut Teknologi dan Bisnis STIKOM Bali
  • Ni Luh Gede Pivin Suwirmayanti Institut Teknologi dan Bisnis STIKOM Bali
  • Komang Budiarta Institut Teknologi dan Bisnis STIKOM Bali
Keywords: Perbandingan, Ekstraksi Fitur, MFCC, Spectral, KNN

Abstract

Tahapan awal dalam pengenalan suara adalah tahap ekstraksi fitur, dimana penerapan metode sangatlah dapat berdampak signifikan terhadap kualitas pengenalan suara, sehingga perlu dilakukan pemilihan metode yang tepat. Metode ekstraksi fitur untuk pengenalan suara diantaranya Mel-Frequency Cepstral Coefficients (MFCC) dan representasi spektral. MFCC telah menjadi standar dalam berbagai aplikasi pengenalan suara karena kemampuannya dalam menangkap karakteristik penting dari suara manusia. Sementara itu, representasi spektral memiliki pendekatan yang lebih sederhana dengan hanya menganalisis amplitudo spektrum suara tanpa mempertimbangkan informasi cepstral. Penelitian ini menggunakan ekstraksi fitur yang dilakukan dengan mengimplementasikan kedua metode, yaitu MFCC dan representasi spektral, pada setiap sampel suara dalam dataset. Selanjutnya, dilakukan pemrosesan data menggunakan algoritma pengenalan pola seperti K-Nearest Neighbors (K-NN) untuk mengklasifikasikan suara pada kedua kelompok fitur. Hasil penelitian ini diperoleh hasilĀ  bahwa MFCC memiliki keunggulan dalam proses identifikasi suara berbasis gender dengan akurasi tertinggi 84,18 untuk data training dan 74,71 untuk data testing dimana kedua hasil ini berasal dari kelompok data yang sama yaitu pembagian 50% data uji dan 50% data training. Hasil eksperimen menunjukkan bahwa penggunaan MFCC cenderung menghasilkan hasil pengenalan suara yang lebih baik dibandingkan dengan representasi spektral. Hal ini disebabkan oleh kemampuan MFCC dalam menangkap informasi frekuensi dan temporal dari suara manusia.

Tahapan awal dalam pengenalan suara adalah tahap ekstraksi fitur, dimana penerapan metode sangatlah dapat berdampak signifikan terhadap kualitas pengenalan suara, sehingga perlu dilakukan pemilihan metode yang tepat. Metode ekstraksi fitur untuk pengenalan suara diantaranya Mel-Frequency Cepstral Coefficients (MFCC) dan representasi spektral. MFCC telah menjadi standar dalam berbagai aplikasi pengenalan suara karena kemampuannya dalam menangkap karakteristik penting dari suara manusia. Sementara itu, representasi spektral memiliki pendekatan yang lebih sederhana dengan hanya menganalisis amplitudo spektrum suara tanpa mempertimbangkan informasi cepstral. Penelitian ini menggunakan ekstraksi fitur yang dilakukan dengan mengimplementasikan kedua metode, yaitu MFCC dan representasi spektral, pada setiap sampel suara dalam dataset. Selanjutnya, dilakukan pemrosesan data menggunakan algoritma pengenalan pola seperti K-Nearest Neighbors (K-NN) untuk mengklasifikasikan suara pada kedua kelompok fitur. Hasil penelitian ini diperoleh hasilĀ  bahwa MFCC memiliki keunggulan dalam proses identifikasi suara berbasis gender dengan akurasi tertinggi 84,18 untuk data training dan 74,71 untuk data testing dimana kedua hasil ini berasal dari kelompok data yang sama yaitu pembagian 50% data uji dan 50% data training. Hasil eksperimen menunjukkan bahwa penggunaan MFCC cenderung menghasilkan hasil pengenalan suara yang lebih baik dibandingkan dengan representasi spektral. Hal ini disebabkan oleh kemampuan MFCC dalam menangkap informasi frekuensi dan temporal dari suara manusia.

Published
2024-07-08
Section
Naratif : Jurnal Nasional Riset, Aplikasi dan Teknik Informatika