Jak to działa
Speech to Text — Live transcribe speech to text using your microphone. Całe przetwarzanie odbywa się w Twojej przeglądarce — bez wgrywania, bez rejestracji, bez e-maila. Za darmo na zawsze.
Najczęściej zadawane pytania
Które przeglądarki to obsługują?
Chrome, Edge i większość przeglądarek opartych na Chromium (Brave, Opera). Safari obsługuje na macOS z ograniczeniami. Firefox obecnie nie udostępnia Web Speech API.
Gdzie odbywa się rozpoznawanie?
Implementacje przeglądarki zwykle wysyłają dźwięk do usługi w chmurze (np. Google) w celu transkrypcji. Transkrypcja wraca do twojej przeglądarki; nigdy jej nie widzimy. Dla pełnej pracy on-device szukaj narzędzi z whisper.cpp.
Czy może transkrybować wielu mówców lub hałaśliwe audio?
Web Speech API jest zoptymalizowane dla jednego mówcy w cichym środowisku. Do diarizacji wielu mówców lub brudnego audio dedykowane narzędzia działają znacznie lepiej.