AI-Powered CAPTCHA Bypass: GPT-4o ve Gemini ile Otomatik CAPTCHA Çözme
Güvenlik araştırmaları yaparken, CAPTCHA’ların ne kadar etkili olduğunu test etmek istedim. Modern AI modellerinin görsel ve metin tabanlı CAPTCHA’ları ne kadar iyi çözebileceğini merak ediyordum. Bu yüzden, OpenAI’nin GPT-4o ve Google’ın Gemini gibi büyük çok modlu modelleri (LMM) kullanarak çeşitli CAPTCHA türlerini otomatik olarak çözen bir araç geliştirdim. Bu araç, Selenium ile web browser automation yaparak CAPTCHA’ları gerçek zamanlı olarak çözüyor ve başarılı çözümleri GIF formatında kaydediyor. Üstelik bu araştırma, Black Hat Sector 2025’te sunuldu.
ai-captcha-bypass Nedir?
ai-captcha-bypass, Python programlama dili ile yazılmış bir command-line tool. Temel olarak, OpenAI’nin GPT-4o ve Google’ın Gemini gibi gelişmiş AI modellerini kullanarak çeşitli CAPTCHA türlerini otomatik olarak çözüyor. Araç, Selenium ile web browser automation yaparak CAPTCHA’ları gerçek zamanlı olarak analiz ediyor ve çözüyor.
Aracın en önemli özelliklerinden biri, hem görsel hem de metin tabanlı CAPTCHA’ları çözebilmesi. Ayrıca, audio CAPTCHA’ları da transcribe edebiliyor. Bu sayede güvenlik araştırmacıları, farklı CAPTCHA türlerinin güvenlik seviyelerini test edebiliyor.
Araç şu ana kadar GitHub’da 949 star topladı ve güvenlik topluluğu tarafından yaygın olarak kullanılıyor. Ayrıca Black Hat Sector 2025’te sunuldu.
Neden ai-captcha-bypass?
Güvenlik araştırmaları yaparken, CAPTCHA’ların ne kadar etkili olduğunu test etmek istedim. Modern AI modellerinin görsel ve metin tabanlı CAPTCHA’ları ne kadar iyi çözebileceğini merak ediyordum. Ayrıca, bug bounty araştırmalarında CAPTCHA’ları bypass etmek gerektiğinde, manuel olarak çözmek zaman alıcı olabiliyor.
Desteklenen CAPTCHA Türleri
ai-captcha-bypass, şu CAPTCHA türlerini çözebiliyor:
- Text Captcha: Basit metin tanıma CAPTCHA’ları
- Complicated Text Captcha: Daha fazla distortion ve noise içeren metin CAPTCHA’ları
- reCAPTCHA v2: Google’ın “I’m not a robot” checkbox’ı ve image selection challenge’ları
- Puzzle Captcha: Slider puzzle’ları, bir parçanın doğru konuma taşınması gereken CAPTCHA’lar
- Audio Captcha: Ses dosyalarından harf veya sayı transcribe etme
Her CAPTCHA türü için özel prompt’lar hazırlandı ve AI modellerinin en iyi sonuçları vermesi için optimize edildi.
Nasıl Çalışıyor?
ai-captcha-bypass’un çalışma mantığı oldukça basit:
- Browser Launch: Selenium ile Firefox browser instance’ı başlatılıyor
- Navigate: Belirtilen CAPTCHA türü için demo sayfasına gidiliyor
- Capture: CAPTCHA challenge’ı (image, instruction veya puzzle) screenshot olarak yakalanıyor
- AI Analysis: Yakalanan görüntüler veya audio dosyaları, seçilen AI provider’a (OpenAI veya Gemini) gönderiliyor ve CAPTCHA türüne özel prompt ile analiz ediliyor
- Get Action: AI, çözümü (text, coordinates veya image selections) döndürüyor
- Perform Action: Selenium ile text giriliyor, slider hareket ettiriliyor veya doğru image’ler tıklanıyor
- Verify: CAPTCHA’nın başarıyla çözülüp çözülmediği kontrol ediliyor
Başarılı çözümler, successful_solves dizininde GIF formatında kaydediliyor. Bu sayede hangi CAPTCHA’ların başarıyla çözüldüğünü görebiliyorsunuz.
Kurulum ve Kullanım
Gereksinimler
- Python 3.7+
- Mozilla Firefox
- OpenAI veya Google Gemini API key’leri
Kurulum
git clone https://github.com/aydinnyunus/ai-captcha-bypass
cd ai-captcha-bypass
pip install -r requirements.txt
API Key’lerini Ayarlama
.env.example dosyasını .env olarak kopyalayın ve API key’lerinizi ekleyin:
cp .env.example .env
.env dosyasını açın ve API key’lerinizi ekleyin:
OPENAI_API_KEY="sk-..."
GOOGLE_API_KEY="..."
Kullanım Örnekleri
Basit text CAPTCHA çözme (OpenAI default):
python main.py text
Complicated text CAPTCHA çözme (Gemini ile):
python main.py complicated_text --provider gemini
reCAPTCHA v2 çözme (Gemini ile):
python main.py recaptcha_v2 --provider gemini
Audio CAPTCHA transcribe etme:
python main.py audio --file files/radio.wav --provider openai
Puzzle CAPTCHA çözme (belirli OpenAI model ile):
python main.py puzzle --provider openai --model gpt-4o
Başarı Örnekleri
Araç, çeşitli CAPTCHA türlerini başarıyla çözüyor. GitHub repository’sinde successful_solves dizininde başarılı çözümlerin GIF’leri bulunuyor. İşte bazı başarı örnekleri:
reCAPTCHA v2
reCAPTCHA v2, Google’ın en yaygın kullanılan CAPTCHA türlerinden biri. Hem OpenAI (GPT-4o) hem de Gemini (2.5 Pro) ile başarıyla çözüldü:

reCAPTCHA v2 başarılı çözüm - OpenAI GPT-4o

reCAPTCHA v2 başarılı çözüm - Gemini 2.5 Pro
Puzzle Captcha
Slider puzzle CAPTCHA’ları, bir parçanın doğru konuma taşınması gereken zorlu bir CAPTCHA türü. Her iki AI modeli de bu tür CAPTCHA’ları başarıyla çözüyor:

Puzzle CAPTCHA başarılı çözüm - OpenAI GPT-4o

Puzzle CAPTCHA başarılı çözüm - Gemini 2.5 Pro
Complicated Text Captcha
Yüksek distortion ve noise içeren metin CAPTCHA’ları, insanlar için bile zor olabilir. Ancak AI modelleri bu tür CAPTCHA’ları da başarıyla okuyor:

Complicated Text CAPTCHA başarılı çözüm - OpenAI GPT-4o

Complicated Text CAPTCHA başarılı çözüm - Gemini 2.5 Pro
Bu örnekler, modern AI modellerinin CAPTCHA’ları ne kadar etkili çözebileceğini gösteriyor. Her GIF, aracın gerçek zamanlı olarak CAPTCHA’yı nasıl çözdüğünü gösteriyor.
Güvenlik ve Etik Kullanım
Bu araç, güvenlik araştırması ve test amaçlı geliştirilmiştir. CAPTCHA’ları otomatik olarak çözmek, bazı web sitelerinin kullanım koşullarını ihlal edebilir. Bu yüzden:
- Sadece kendi web sitenizde veya izin verilen test ortamlarında kullanın
- Yasal ve etik kurallara dikkat edin
- Başkalarının web sitelerinde izinsiz kullanmayın
Araç, güvenlik araştırmacılarının CAPTCHA’ların güvenlik seviyelerini test etmesi ve iyileştirmeler önermesi için geliştirilmiştir.
Proje Yapısı
main.py: Ana entry point, command-line argument’ları handle ediyor ve uygun test fonksiyonlarını çağırıyorai_utils.py: OpenAI ve Gemini API’leri ile etkileşim için fonksiyonlar içeriyor. Prompt’lar burada tanımlanıyor ve API call’ları yapılıyorpuzzle_solver.py: Multi-step slider puzzle CAPTCHA’ları çözmek için özel logic içeriyorbenchmark.py: Farklı solver’ların performansını ve başarı oranını değerlendirmek için multiple test çalıştıran scriptsuccessful_solves/: Başarılı çözümlerin GIF’lerinin kaydedildiği dizin
Sonuç
ai-captcha-bypass, modern AI modellerini kullanarak CAPTCHA’ları otomatik olarak çözen yenilikçi bir araç. Hem güvenlik araştırmacıları hem de geliştiriciler için değerli bir kaynak. Araç, çeşitli CAPTCHA türlerini çözebiliyor ve başarılı çözümleri kaydediyor.
Eğer CAPTCHA güvenliği hakkında daha fazla bilgi edinmek istiyorsanız, exifLooter: Fotoğraflardan Gizli Konum Bilgilerini Çıkarmak yazısına göz atabilirsiniz. Ayrıca diğer güvenlik projelerimi de inceleyebilirsiniz.