Nasıl çalışır
Sesten Metne — Mikrofonu kullanarak konuşmayı canlı metne dönüştür. Tüm işlemler tarayıcında yapılır — yükleme yok, üyelik yok, e-posta gerek yok. Sonsuza dek ücretsiz.
Son güncelleme:
Sesten Metne hakkında
Konuşmayı Yazıya Çevir, mikrofonundan söylediğin her şeyi sayfada anlık olarak metne dönüştürür. Tarayıcının Web Speech Recognition API'sini kullanır — hızlı not, mesaj yazma veya toplantıda fikir yakalamak için ideal, kurulum gerektirmeyen bir dikte aracıdır.
Gazeteciler röportaj parçaları yakalar, öğrenciler ders notu dikte eder, geliştiriciler backend kurmadan ses özelliği prototipler. Tanıma Stop'a basana kadar sürekli çalışır ve kopyalayıp düzenleyebileceğin bir transkript birikir.
Tarayıcı desteği eşit dağılmaz. Ses tanıma en iyi Chrome ve Edge'de çalışır; çoğu Chromium tarayıcı (Brave, Opera) da çalışır. Safari macOS'te kısmi destek verir; Firefox şu an API'yi açmaz.
Sesten Metne nasıl kullanılır
- Tanıyıcının doğru akustik modeli kullanması için Language dropdown'undan dili seç.
- Start listening'e tıkla. Tarayıcı mikrofon izni isteyecek — bir kez kabul et.
- Doğal konuş. Mikrofon aktifken Listening… durumu görünür ve kelimeler tanındıkça transkript dolar.
- Bittiğinde Stop'a tıkla. Transkript ekranda kalır, düzenleyebilir veya kopyalayabilirsin.
- Tanıma beklenmedik şekilde duraklarsa Start listening'e tekrar basıp devam et.
Yaygın kullanım senaryoları
- Yürüyüş sırasında sesli not yakalayıp düzenlenebilir metne çevirmek.
- Yazmak yerine konuşarak blog yazısı veya e-posta taslağı çıkarmak — ilk taslak için çok daha hızlı.
- Aranabilir arşivler için röportaj veya podcast'lerin kaba transkriptini çıkarmak.
- Erişilebilirlik: yazmakta zorlanan veya acı çeken kullanıcılar için eller serbest girdi.
- Yabancı dil pratiği yapıp telaffuzunun doğru tanındığını doğrulamak.
İpuçları ve dikkat edilmesi gerekenler
- Sessiz bir ortam ve düzgün bir mikrofon kullan. Arka plan gürültüsü doğruluğu çökertir.
- Kısa, tam cümlelerle konuş — tanıyıcı duraklamalara ve tonlamaya göre noktalama ekler.
- API birkaç saniye sessizlikten sonra dinlemeyi bırakırsa tekrar Start'a bas. Kaldığın yerden devam ederiz.
- Doğru dil varyantını seç (örn. en-US vs en-GB). Model lokale göre tunelenir, aksan önemlidir.
Sıkça sorulan sorular
Hangi tarayıcılar destekliyor?
Chrome, Edge ve çoğu Chromium tabanlı tarayıcı (Brave, Opera). Safari macOS'te kısıtlı destekler. Firefox şu an Web Speech API'sini açmıyor.
Tanıma nerede gerçekleşiyor?
Tarayıcı implementasyonları sesi genelde transkripsiyon için bir bulut servisine (örn. Google) gönderir. Metin tarayıcına geri gelir; biz görmeyiz. Tamamen cihazda olması için whisper.cpp tabanlı araçlara bak.
Çok konuşmacı veya gürültülü sesi yazıya dökebilir mi?
Web Speech API tek konuşmacı ve sessiz ortam için optimize. Çoklu konuşmacı diarizasyonu veya kötü ses için özel araçlar çok daha iyi çalışır.
Ses bir sunucuya gidiyor mu?
Tarayıcıların Web Speech API implementasyonları genelde sesi tanıma için satıcının bulut servisine gönderir (Chrome için Google, Edge için Microsoft). Biz ne sesi ne transkripti görmüyoruz — ama tarayıcı satıcısı görüyor. Tamamen cihaz üstü tanıma için whisper.cpp tabanlı araçlara bak.
Tanıma Safari'de neden Chrome'a göre çok daha kötü?
Safari, Speech Recognition spec'inin daha eski bir alt kümesini implement eder ve Apple'ın cihaz üstü modelini kullanır — Siri komutları için optimize, açık vokabulü dikte için değil. Belirgin doğruluk için Chrome veya Edge dene.
Ürün ismi gibi özel sözcükler ekleyebilir miyim?
Web Speech API özel vokabuler hook'u açmaz. Yaygın çözümler: ilk seferde sıradışı ismi harf harf söyle veya transkript üzerinde sonradan find-and-replace uygula.