Dalam kehidupan sehari-hari, sangat penting bagi kita untuk memahami keadaan emosi seseorang dengan emosi tertentu karena emosi merupakan salah satu hal yang penting bagi kehidupan. Emosi adalah perasaan intens yang diarahkan pada seseorang atau sesuatu. Jenis-jenis emosi dapat dikategorikan sebagai depresi, kecemasan, bosan, frustrasi, ketakutan, kebahagiaan, netral, panik, kesedihan, stres, kejutan, kaget, dan khawatir.
Salah satu bentuk interaksi antara manusia dan komputer adalah ucapan. Pidato terdiri dari kata-kata yang diucapkan dengan berbagai cara. Jika hanya mengamati apa yang diucapkan tanpa memperhatikan cara pengucapan kata tersebut, kemungkinan aspek penting dari tuturan tersebut akan hilang, bahkan dapat terjadi kesalahpahaman. Sistem berbasis ucapan tersebut dapat berfungsi baik secara independen atau sebagai modul teknik yang lebih canggih yang menggabungkan sumber informasi lain seperti ekspresi wajah dan gerakan. Tantangan di bidang pengenalan suara adalah mendeteksi emosi pembicara. Emosi adalah perasaan intens yang ditujukan kepada seseorang atau sesuatu. Selain itu, emosi dapat diartikan sebagai reaksi yang timbul sebagai akibat dari tindakan seseorang atau peristiwa tertentu. Untuk mendapatkan nilai statistik dari fitur energi, kami menggunakan fungsi jangka pendek untuk mengekstrak nilai energi di setiap frame ucapan.