PERBANDINGAN KUALITAS PENGENALAN SUARA UNTUK EKSTRAKSI FITUR MENGGUNAKAN MFCC DAN SPECTRAL
Tahapan awal dalam pengenalan suara adalah tahap ekstraksi fitur, dimana penerapan metode sangatlah dapat berdampak signifikan terhadap kualitas pengenalan suara, sehingga perlu dilakukan pemilihan metode yang tepat. Metode ekstraksi fitur untuk pengenalan suara diantaranya Mel-Frequency Cepstral Co...
Saved in:
Published in | Naratif : Jurnal Nasional Riset, Aplikasi dan Teknik Informatika Vol. 6; no. 1; pp. 58 - 63 |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | English |
Published |
08.07.2024
|
Online Access | Get full text |
Cover
Loading…
Summary: | Tahapan awal dalam pengenalan suara adalah tahap ekstraksi fitur, dimana penerapan metode sangatlah dapat berdampak signifikan terhadap kualitas pengenalan suara, sehingga perlu dilakukan pemilihan metode yang tepat. Metode ekstraksi fitur untuk pengenalan suara diantaranya Mel-Frequency Cepstral Coefficients (MFCC) dan representasi spektral. MFCC telah menjadi standar dalam berbagai aplikasi pengenalan suara karena kemampuannya dalam menangkap karakteristik penting dari suara manusia. Sementara itu, representasi spektral memiliki pendekatan yang lebih sederhana dengan hanya menganalisis amplitudo spektrum suara tanpa mempertimbangkan informasi cepstral. Penelitian ini menggunakan ekstraksi fitur yang dilakukan dengan mengimplementasikan kedua metode, yaitu MFCC dan representasi spektral, pada setiap sampel suara dalam dataset. Selanjutnya, dilakukan pemrosesan data menggunakan algoritma pengenalan pola seperti K-Nearest Neighbors (K-NN) untuk mengklasifikasikan suara pada kedua kelompok fitur. Hasil penelitian ini diperoleh hasil bahwa MFCC memiliki keunggulan dalam proses identifikasi suara berbasis gender dengan akurasi tertinggi 84,18 untuk data training dan 74,71 untuk data testing dimana kedua hasil ini berasal dari kelompok data yang sama yaitu pembagian 50% data uji dan 50% data training. Hasil eksperimen menunjukkan bahwa penggunaan MFCC cenderung menghasilkan hasil pengenalan suara yang lebih baik dibandingkan dengan representasi spektral. Hal ini disebabkan oleh kemampuan MFCC dalam menangkap informasi frekuensi dan temporal dari suara manusia. Tahapan awal dalam pengenalan suara adalah tahap ekstraksi fitur, dimana penerapan metode sangatlah dapat berdampak signifikan terhadap kualitas pengenalan suara, sehingga perlu dilakukan pemilihan metode yang tepat. Metode ekstraksi fitur untuk pengenalan suara diantaranya Mel-Frequency Cepstral Coefficients (MFCC) dan representasi spektral. MFCC telah menjadi standar dalam berbagai aplikasi pengenalan suara karena kemampuannya dalam menangkap karakteristik penting dari suara manusia. Sementara itu, representasi spektral memiliki pendekatan yang lebih sederhana dengan hanya menganalisis amplitudo spektrum suara tanpa mempertimbangkan informasi cepstral. Penelitian ini menggunakan ekstraksi fitur yang dilakukan dengan mengimplementasikan kedua metode, yaitu MFCC dan representasi spektral, pada setiap sampel suara dalam dataset. Selanjutnya, dilakukan pemrosesan data menggunakan algoritma pengenalan pola seperti K-Nearest Neighbors (K-NN) untuk mengklasifikasikan suara pada kedua kelompok fitur. Hasil penelitian ini diperoleh hasil bahwa MFCC memiliki keunggulan dalam proses identifikasi suara berbasis gender dengan akurasi tertinggi 84,18 untuk data training dan 74,71 untuk data testing dimana kedua hasil ini berasal dari kelompok data yang sama yaitu pembagian 50% data uji dan 50% data training. Hasil eksperimen menunjukkan bahwa penggunaan MFCC cenderung menghasilkan hasil pengenalan suara yang lebih baik dibandingkan dengan representasi spektral. Hal ini disebabkan oleh kemampuan MFCC dalam menangkap informasi frekuensi dan temporal dari suara manusia. |
---|---|
ISSN: | 2656-7377 2714-8467 |
DOI: | 10.53580/naratif.v6i1.281 |