Hammerspoon Dictation: Metal GPU Hızlandırmalı Sesli Yazıya Çevirme

macOS için Metal GPU hızlandırmalı sesli yazıya çevirme sistemi

r/ClaudeAIr/macOSr/LocalLLaMA

macOS için yerel GPU kullanarak ses-metin dönüşümü yapan sistem. Claude Code ile yazdım.

Alt+A → konuş → Alt+A → metin yapışır. 0.3-1.5 saniye.

Akış

Alt+A tuşuna bas (TR) / Alt+Shift+A (EN)

Hammerspoon hotkey yakala

audiorecord.swift kayda başla → Görsel gösterge (◉ REC)

Alt+A tekrar bas

audiorecord.swift kaydet ~/Recordings/*.wav

voice-transcribe.ts orkestrasyon

  ┌─────────────────────────────────────────┐
  │ Sağlayıcı Kademesi (hata → sonraki)     │
  ├─────────────────────────────────────────┤
  │ 1. Parakeet :8768                       │
  │    ├─ Sadece İngilizce                  │
  │    ├─ ~0.3s                             │
  │    ├─ Ücretsiz, GPU                     │
  │    └─ HTTP istek                        │
  │         ↓ (hata veya TR)                │
  │ 2. Whisper MLX :8770                    │
  │    ├─ Türkçe/İngilizce                  │
  │    ├─ ~1.5s                             │
  │    ├─ Ücretsiz, GPU                     │
  │    └─ WebSocket stream                  │
  │         ↓ (hata veya kapalı)            │
  │ 3. ElevenLabs API (opsiyonel)           │
  │    ├─ Bulut                             │
  │    ├─ ~2-3s                             │
  │    └─ API key gerekli                   │
  │         ↓ (hata veya kapalı)            │
  │ 4. OpenAI Whisper API (opsiyonel)       │
  │    ├─ Bulut                             │
  │    ├─ ~2-3s                             │
  │    └─ API key gerekli                   │
  └─────────────────────────────────────────┘

Transkript metni döndü

Akıllı pano: eski kaydet → yeni yapıştır → eski geri yükle

Metin aktif uygulamada görünür + boşluk ekle

Mimari

Kurulum

Otomatik yükleyici her şeyi kuruyor. 5 dakika.

hammerspoon-dictation

Last updated

Was this helpful?