Question 1

Które przeglądarki to obsługują?

Accepted Answer

Chrome, Edge i większość przeglądarek opartych na Chromium (Brave, Opera). Safari obsługuje na macOS z ograniczeniami. Firefox obecnie nie udostępnia Web Speech API.

Question 2

Gdzie odbywa się rozpoznawanie?

Accepted Answer

Implementacje przeglądarki zwykle wysyłają dźwięk do usługi w chmurze (np. Google) w celu transkrypcji. Transkrypcja wraca do twojej przeglądarki; nigdy jej nie widzimy. Dla pełnej pracy on-device szukaj narzędzi z whisper.cpp.

Question 3

Czy może transkrybować wielu mówców lub hałaśliwe audio?

Accepted Answer

Web Speech API jest zoptymalizowane dla jednego mówcy w cichym środowisku. Do diarizacji wielu mówców lub brudnego audio dedykowane narzędzia działają znacznie lepiej.

Question 4

Jakie języki są obsługiwane?

Accepted Answer

Lista języków zależy od przeglądarki — w nowoczesnym Chrome dostępny jest polski oraz dziesiątki innych języków.

Question 5

Co poprawi jakość transkrypcji?

Accepted Answer

Mów wyraźnie, używaj dobrego mikrofonu i ogranicz hałas tła. Dobra akustyka znacząco poprawia trafność.

Question 6

Czy moje nagrania są bezpieczne?

Accepted Answer

Multilities nie przechowuje nagrań — transkrypcja korzysta z lokalnych mechanizmów przeglądarki.

Mowa na tekst

Jak to działa

O Mowa na tekst

Najczęściej zadawane pytania

Powiązane narzędzia