IMPLEMENTASI TEKNOLOGI SPEECH-TO-TEXT DAN TEXT-TO-SPEECH PADA JAM WEKER DIGITAL DENGAN FITUR INTERAKSI SUARA Moch Rendy Ardiyanto, NIM E32220274, Tahun 2025, Politeknik Negeri Jember, I Gede Wiryawan, S.Kom., M.Kom. (Pembimbing I)
Sistem jam weker digital ini dirancang untuk memudahkan pengguna dalam mengatur dan memantau alarm melalui perintah suara. Dengan memanfaatkan Deepgram API untuk mentranskripsi suara ke teks (Speech-to-Text), Gemini AI untuk memproses perintah, dan VoiceRSS API untuk menghasilkan suara respons (Text-to-Speech), sistem mampu menangani alur komunikasi end-to-end pada mikrokontroler ESP32. Pengujian pada kondisi SNR ??20?dB dan suhu 23–25?°C (ruangan normal) menghasilkan akurasi STT rata?rata 96%, latency end-to-end 16,5 detik, respons rata?rata 7 kata, dan durasi pemutaran suara hasil TTS 3,5 detik, sekaligus menunjukkan operasi stabil tanpa crash. Dengan optimasi pre-processing audio, manajemen buffer adaptif, serta manajemen daya deep-sleep, sistem diharapkan meningkatkan responsivitas, efisiensi energi, dan keandalan pada iterasi selanjutnya.