Üretken Yapay zekalar ortasında en ön plana çıkanlardan birisi olan ChatGPT lakin faal olarak sunulan sürümünde şimdi görselleri ve görüntüleri tahlil edemiyor. Pekala, edebilseydi neler yapabilirdi?
İşte bu sorunun yanıtı, Yapay zeka geliştiricisi Mckay Wrigley tarafından verildi. Wrigley, iPhone ve MacBook kullanarak, yazdığı yazılım sayesinde ChatGPT’ye ‘göz’ verdi. ChatGPT, etraftaki objelere nazaran teklifler de yaptı.
CHATGPT’NİN GÖZLERE SAHİP OLDUĞU O VİDEO
I used my iPhone to give GPT-4 eyes.
My AI vision assistant:
– learned what a Keto diet is
– identified Keto foods in my fridge
– searched the internet
– found a recipe with the ingredientsThe future is here! pic.twitter.com/bOMhJfWRP0
— Mckay Wrigley (@mckaywrigley) May 2, 2023
Webtekno’da yer Meydan habere nazaran Wrigley’nin etrafındaki bütün objeler ve buzdolabındaki yiyecek ve içecekler, farklı bir Yapay zeka ile tanınıyor. Daha sonrasında bu datalar ChatGPT’ye sunuluyor. ChatGPT, bir soruyla Evvel hangi objelerin etrafta olduğunu öğreniyor, akabinde bu objelere ait bir öbür soruyu da cevaplıyor.
Wrigley, bu metot ile ChatGPT’ye buzdolabındaki objeleri gösteriyor, öğretiyor. Sonrasında ise ChatGPT’den buzdolabındaki içeriklere Müsait bir Tanım vermesini istiyor. ChatGPT, internette kısa bir arama yaptıktan sonra Müsait tanımı anlatıyor.
Videodaki sesli konuşma da elbette ChatGPT’nin yapabildiği bir şey değil. Wrigley, yazının anlık olarak sese dönüştürülmesi için OpenAI’ın Whisper Yapay zekasından faydalanıyor. Kendisinin kullandığı bütün Yapay zekalar ve kullanım maksatları ise şu biçimde:
- GPT-4: ChatGPT’yi oluşturan lisan modeli
- YoloV8: Kameraya gözüken objeleri tanımlayan Yapay zeka
- Whisper: Metnin sese dönüştürülmesi
- Google Custom Search Engine: ChatGPT’nin internette arama yapmasını sağlayan araç
Wrigley, bu Yapay zekaları Python ile yazdığı kodlar ile bir ortada çalıştırıyor ve ortaya bu türlü bir Sonuç çıkıyor. Wrigley, Apple’ın piyasaya sürmeye hazırlandığı artırılmış gerçeklik gözlükleri için de araçlar geliştirmeye hazırlandığını söylüyor.
Bir öteki deyişle üstteki görüntü, artırılmış gerçeklik gözlüklerinin halihazırda bildiğimiz bir potansiyelinin somut bir formda sunumu.
Yorum Yok