PERBANDINGAN KUALITAS PENGENALAN SUARA UNTUK EKSTRAKSI FITUR MENGGUNAKAN MFCC DAN SPECTRAL

Tahapan awal dalam pengenalan suara adalah tahap ekstraksi fitur, dimana penerapan metode sangatlah dapat berdampak signifikan terhadap kualitas pengenalan suara, sehingga perlu dilakukan pemilihan metode yang tepat. Metode ekstraksi fitur untuk pengenalan suara diantaranya Mel-Frequency Cepstral Co...

Full description

Saved in:
Bibliographic Details
Published inNaratif : Jurnal Nasional Riset, Aplikasi dan Teknik Informatika Vol. 6; no. 1; pp. 58 - 63
Main Authors Diaz, Ricky Aurelius Nurtanto, Suwirmayanti, Ni Luh Gede Pivin, Budiarta, Komang
Format Journal Article
LanguageEnglish
Published 08.07.2024
Online AccessGet full text

Cover

Loading…
More Information
Summary:Tahapan awal dalam pengenalan suara adalah tahap ekstraksi fitur, dimana penerapan metode sangatlah dapat berdampak signifikan terhadap kualitas pengenalan suara, sehingga perlu dilakukan pemilihan metode yang tepat. Metode ekstraksi fitur untuk pengenalan suara diantaranya Mel-Frequency Cepstral Coefficients (MFCC) dan representasi spektral. MFCC telah menjadi standar dalam berbagai aplikasi pengenalan suara karena kemampuannya dalam menangkap karakteristik penting dari suara manusia. Sementara itu, representasi spektral memiliki pendekatan yang lebih sederhana dengan hanya menganalisis amplitudo spektrum suara tanpa mempertimbangkan informasi cepstral. Penelitian ini menggunakan ekstraksi fitur yang dilakukan dengan mengimplementasikan kedua metode, yaitu MFCC dan representasi spektral, pada setiap sampel suara dalam dataset. Selanjutnya, dilakukan pemrosesan data menggunakan algoritma pengenalan pola seperti K-Nearest Neighbors (K-NN) untuk mengklasifikasikan suara pada kedua kelompok fitur. Hasil penelitian ini diperoleh hasil  bahwa MFCC memiliki keunggulan dalam proses identifikasi suara berbasis gender dengan akurasi tertinggi 84,18 untuk data training dan 74,71 untuk data testing dimana kedua hasil ini berasal dari kelompok data yang sama yaitu pembagian 50% data uji dan 50% data training. Hasil eksperimen menunjukkan bahwa penggunaan MFCC cenderung menghasilkan hasil pengenalan suara yang lebih baik dibandingkan dengan representasi spektral. Hal ini disebabkan oleh kemampuan MFCC dalam menangkap informasi frekuensi dan temporal dari suara manusia. Tahapan awal dalam pengenalan suara adalah tahap ekstraksi fitur, dimana penerapan metode sangatlah dapat berdampak signifikan terhadap kualitas pengenalan suara, sehingga perlu dilakukan pemilihan metode yang tepat. Metode ekstraksi fitur untuk pengenalan suara diantaranya Mel-Frequency Cepstral Coefficients (MFCC) dan representasi spektral. MFCC telah menjadi standar dalam berbagai aplikasi pengenalan suara karena kemampuannya dalam menangkap karakteristik penting dari suara manusia. Sementara itu, representasi spektral memiliki pendekatan yang lebih sederhana dengan hanya menganalisis amplitudo spektrum suara tanpa mempertimbangkan informasi cepstral. Penelitian ini menggunakan ekstraksi fitur yang dilakukan dengan mengimplementasikan kedua metode, yaitu MFCC dan representasi spektral, pada setiap sampel suara dalam dataset. Selanjutnya, dilakukan pemrosesan data menggunakan algoritma pengenalan pola seperti K-Nearest Neighbors (K-NN) untuk mengklasifikasikan suara pada kedua kelompok fitur. Hasil penelitian ini diperoleh hasil  bahwa MFCC memiliki keunggulan dalam proses identifikasi suara berbasis gender dengan akurasi tertinggi 84,18 untuk data training dan 74,71 untuk data testing dimana kedua hasil ini berasal dari kelompok data yang sama yaitu pembagian 50% data uji dan 50% data training. Hasil eksperimen menunjukkan bahwa penggunaan MFCC cenderung menghasilkan hasil pengenalan suara yang lebih baik dibandingkan dengan representasi spektral. Hal ini disebabkan oleh kemampuan MFCC dalam menangkap informasi frekuensi dan temporal dari suara manusia.
ISSN:2656-7377
2714-8467
DOI:10.53580/naratif.v6i1.281