Voice Activity
—
Streaming Voice Stack
Браузер шлет PCM-стрим в gateway, VAD отслеживает тишину, ASR собирает partial и final транскрипт, LLM отвечает токенами, а TTS возвращает озвученные сегменты обратно в UI.
—
Лучше тестировать в наушниках, чтобы озвучка не попадала обратно в микрофон.
Voice Activity
—
Signal Level
— dBFS
Noise Floor
— dBFS