Chrome CDP: AI ile Tarayıcı Kontrolü

AI'ya Chrome'umu verdim. 3 agent çalışıyor - 1 geliştirici, 2 tester. Puppeteer yok, direkt tarayıcım. 8 sekme aynı anda dans ediyor.

"Valla umarım patlatmazsınız Chrome'umu." Sağ alttaki agent kod yazıyor, yukarıdaki ve soldaki testleri koşuyor. Hepsi benim Chrome'uma bağlı. Aynı tarayıcı. Aynı sekmelerde geziniyor, popup açıyor, Reddit'e giriyor. İlk tepkim buydu.

Akış şu: agent Chrome'a erişiyor, JavaScript çalıştırıyor, tab açıyor/kapatıyor, sayfalar arası geziniyor. chrome-cdp eval "document.title" yazıyor, sayfa başlığı geliyor. chrome-cdp tabs list yazıyor, 8 sekme listesi geliyor. Düşünmeye gerek yok, direkt aksiyon.

Multi-agent setup var. Sağdaki geliştirici Chrome tool'unu düzeltiyor. Soldaki ve yukarıdaki agentlar test ediyor - "birden fazla sekme üzerinde oyna", "popup çıkar", "Reddit'e gir, profilimi bul, yorumları çek, görselleştir" tarzı talimatlar veriyorum. Agent'lar koordine çalışıyor, user-developer loop gibi. Hata buldukça geliştirici düzeltiyor.

Pattern şu: JavaScript eval = tam kontrol. Puppeteer indirmeye gerek yok, Chrome zaten var. DevTools Protocol üzerinden bağlanıyorsun, her şeye erişiyorsun. Multi-tab yönetimi agentlar kendisi çözüyor - "insan nasıl araştırır" sorusunu soruyorlar. 7-8 sekme açıyorlar, hepsinde farklı şeyler yapıyorlar, sonucu birleştiriyorlar.

Lokal çalışıyor. Güvenlik problemi yok, kendi tarayıcına erişiyorsun. Aynı pattern VSCode için çalışır, MacOS için çalışır, Hammerspoon için çalışır. Şu an Chrome'da test ettim, yarın başka bir app bağlanır.

Kod GitHub'da. chrome-cdp CLI tool. Environment variable'lar: Chrome DevTools Protocol endpoint (genelde localhost:9222). Chrome'u --remote-debugging-port=9222 flag'i ile başlatman lazım.

Sırada ne yapacağım, bilmem :D

PreviousOtomasyonlar NextPhilips Hue: Yapay Zeka ile Sesli Kontrol

Last updated 20 hours ago

Was this helpful?