ChatGPT 4.0’ın chatbot evreninde büyük dalgalar yaratması bekleniyor. Ama selefinden gerçekten üstün mü? Kontrol edelim.
ChatGPT, yaklaşan otomasyon buzdağının sadece görünen kısmıydı ve Google, Microsoft ve diğer birçok yapay zeka öncelikli şirket bunu takip etti.
Yeni başlayanlar için, çoğu büyük teknolojiye ait olmayan ChatGPT gibi birkaç sohbet robotu bulduk.
Ama buna pazarlamanın gücü deyin; ChatGPT, bu tür tüm AI botlarının hüküm süren kralı olmaya devam ediyor. Matematik, şiir ve blog gönderileri dahil pek çok şey yapabilir ve insanlar bunu dava açmak için bile kullanıyor.
DoNotPay, robocallers’ı 1.500 $’a dava etmek için “tek tıklamayla açılan davalar” oluşturmak üzere GPT-4’ü kullanmaya çalışıyor. Bir arama aldığınızı, bir düğmeye tıkladığınızı, aramanın yazıya döküldüğünü ve 1.000 kelimelik dava oluşturulduğunu hayal edin. GPT-3.5 yeterince iyi değildi, ancak GPT-4 işi son derece iyi yapıyor: pic.twitter.com/gplf79kaqG
– Joshua Browder (@jbrowder1) 14 Mart 2023
Beceri setlerinin yakın gelecekte işe yaramaz hale gelmesinden endişe eden çok sayıda profesyonel var.
Ancak, şöyle bir Linkedin gönderisi okudum:
AI sizin yerinizi almaz, ancak AI kullanan bir kişi olabilir.
Öyleyse, parmaklarımızı çapraz tutarak, en son ChatGPT güncellemesi hakkında eğitim alalım ve önceki sürümlerden ne kadar farklı olduğunu görelim.
ChatGPT: Eski, Varsayılan ve Güncelleme
Dolayısıyla, ücretli kullanıcılar için üç sürüm mevcuttur: Eski (3.5), Varsayılan (3.5) ve en son ChatGPT Güncellemesi (4).
Yetenekleri hakkında biraz daha derine inecek olsak da, OpenAI’nin farklılıklar hakkında söyleyeceği şey şu:
Kaynak: OpenAI
Bu nedenle, ücretsiz kullanıcıların oynayacakları yalnızca Legacy 3.5 varken, premium abonelik, kullanıcıların en iyi olduğunu düşündükleri şeye karar vermek için üçünü de sunar.
Yukarıdaki görüntüyü özetlemek gerekirse, ücretli planlar makul bir hızda daha doğru sonuçlar almakla ilgilidir. Bununla birlikte, ayrımlar yalnızca yönlendirmeler karmaşıksa ve yaratıcılığa ihtiyaç duyuyorsa belirgindir.
ParametreChatGPT 4ChatGPT 3.5Bar Sınav PuanıÜst %10Alt %10AI2 Akıl Yürütme Zorluğu (ARC)96,3%85,2%Python Kodlama Puanı67%48,1%Görsel YorumlamaEvetHayırBağlam 25.000 kelimeden fazlaDaha azKaynak: OpenAI
Ayrıca ChatGPT 4 görsel girişleri kabul edebilir.
Pekala, ders kitabı tanımlarından bu kadar yeter. Ellerimizi kirletelim ve bu adayları gerçek hayattaki savaş alanında değerlendirelim.
Diğer bölümler net görünmeyen görüntülerle doludur. Böyle bir durumda, düzgün bir şekilde görüntülemek için herhangi bir resme sağ tıklayın ve Yeni sekmede aç’ı seçin.
Matematik
Bir mühendislik mezunu olarak, onlara bazı temel problemleri atmaktan kendimi alamıyorum. Cebirsel denklemlerle kolay başlayalım.
Aşama I
Birçoğumuz x için çözmemiz gereken bu ax2+bx+c=0 denklemlerini gördük. Burada şu basit istemi verdim: x için çözün: x2 + x – 6 = 0
Hepsi aynı kökleri verirken (X= -3,2), Legacy ve Update, sonucu bulmak için (herhangi bir öğrencinin yapacağı gibi) formülü doğrudan kullanma konusunda daha benzerdi.
Bununla birlikte, Default 3.5, normalde herhangi bir yetenekli öğrencinin bu tür sıradan denklemler verildiğinde uyguladığı çarpanlara ayırma da dahil olmak üzere iki yöntemi açıkladı.
Aşama II
Sonra ondan biraz karmaşık bir kübik denklemi çözmesini istiyorum: x^3 -12x^2 + 48x – 64 = 0.
Bu, ChatGPT 4’ün neden “güncelleme” olduğunu gerçekten kanıtladı.
İşte yanıtlar:
Tüm bu aldatmaca ve ChatGPT Legacy ve Default, genel bir kübik denklemi çözemedi. Ancak Legacy biraz daha iyi yaptı ve iki kökü doğru buldu, Default ise hepsinde başarısız oldu.
Güncelleme, ikinci aşamada açık ara galip geldi ve denklemi mükemmel bir şekilde çözerek üç kökü de güzel bir açıklamayla buldu.
Mantıksal akıl yürütme
Pek çok temel matematik probleminin sözlük çözümleri olduğunu rahatlıkla varsayabiliriz. Teoremi veya formülü biliyorsanız, değerleri girin ve sonuçları alın.
Ve yapay zeka olan ChatGPT, bu tür sorguları hızlı bir şekilde çözebilir. Bununla birlikte, mantıksal akıl yürütme, yapay zekanın başarısız olma ihtimalinin yüksek olduğu farklı bir alandır.
Aşama I
Onlara klasiği verdim:
A, B’den daha yaşlıdır.
C, A’dan daha yaşlıdır.
B, C’den daha yaşlıdır.
İlk iki ifade doğruysa üçüncü ifade doğru mu yanlış mı?
Ve tüm ChatGPT sürümleri, üçüncü ifadenin yanlış olduğunu belirtmekte haklıydı.
Sonra, alfabe yerine isimler kullandım ve sonuçlar sizi şaşırtabilir:
Böylece, Varsayılan 3.5 ortalamanın altındaki performansını sürdürdü ve bu mütevazı varyasyonla karıştırıldı. Yine de Legacy ve Update en iyi performansı gösterdi.
Aşama II
Şimdiye kadar bu Aşama I ve Aşama II’nin amacının, belirli bir istemin karmaşıklığının Güncellemeyi diğer ikisinden ayırdığı fark noktasını bulmak olduğunu fark etmiş olabilirsiniz.
Buradaki bilgi istemi basit bir mantıksal bilmeceydi:
Bir sabah güneş doğduktan sonra, Rohit bir direğe dönük duruyordu. Direğin gölgesi tam sağına düşüyordu. Hangi yöne bakıyordu?
A. Kuzey
B. Batı
C. Güney
D. Doğu
Bu, Legacy’yi yanlış bir yanıt vermeye iterken, Varsayılan, yanlış bir sonuca götüren belirsiz açıklamalarla yanıt verdi.
Yalnızca Güncelleme, takip etmesi kolay ifadelerle doğru yanıtla parladı.
Edebiyat
Dava açmak zor olabilir, ancak bazen çarpıcı bir ilk bildirim taslağı hazırlayabilirseniz iş o noktaya gelmez.
İşte, şu istemle gittim: Tweetlerimden birine cevap vermediğim için Tim Cook’a apple’ı bana vermesi için bir mektup yaz.
Komik, evet! Ama AI’nın bundan ne çıkarabileceğini görelim.
Legacy 3.5 istemi hemen bir robo-köle gibi aldı ve amaçlanan hedefine ulaşırsa beni mükemmel bir alay konusu haline getirebilecek bir mektup yazdı.
Varsayılan da iyi değildi. Ancak, huysuz yaşlı bir adamın beş yaşındaki bir çocuğa yapacağı gibi beni kapattı.
Yapılan argümanlar kesin olsa da, bu, çok az öğrenme ile eğlenceyi orada bitirdi.
Bu yeterince basit bir istem olmasına rağmen, biraz düşünmeyi ve yaratıcılığı gerektiriyordu. Ve büyük kardeş Update’in iddiasını ortaya koyduğu yer burasıdır:
İlk olarak, bu neredeyse mükemmel bir şekilde hazırlandı. İkincisi, beni Apple genel merkezinin adresini Google’da aramaktan kurtardı (yine de bu tür girişlerin doğrulanması gerekir).
Üçüncüsü, resmi bir tonla ve esprili bir dokunuşla güzelce yazılmıştı. Ayrıca konu satırında niyet açıktı.
Ve yine de mektup, hoşnutsuz bir Apple hayranının duygularını aktarıyordu.
Bu, ChatGPT 4’ü (Güncelleme olarak da bilinir) eski kuzenlerinden kilometrelerce önde yapar. Korkunç derecede zeki ve bazı sağduyu belirtileri var, bu da onu sıkıcı, sıkıcı bir sohbet robotundan daha fazlası yapıyor.
Şiir
ChatGPT’nin piyasaya sürülmesiyle, şiirin zayıf noktası olabileceğini düşündüm.
Ne de olsa, bir insanın okuyucularında gerçekten yankı uyandıran bir şey yaratması duygu, yaratıcılık ve çok çaba gerektirir.
Basitçe söylemek gerekirse, şiir sanatın en iyisidir ve yapay zekanın başarısız olmasını gizlice diledim. Ancak bu, iş arkadaşımın trtechpc.eu’in Slack kanalında bu 4.0 güncellemesinden önceki bir ChatGPT oluşturmasıyla hepimizi sert bir şekilde etkilemesinden önceydi.
Aşama I
Adaylarımıza verdiğim istem şu şekildedir: “Mevcut menüleri ile birlikte burgerlerin neden veya neden servis edilmemesinin domino pizza zincirine fayda sağlayabileceğini şiirsel bir şekilde ifade edin. 100 kelimeden az tutun.”
Farkı görebiliyor musun?
Varsayılan sürüm çok kısaydı, yalnızca 32 kelimeydi ve yaratıcılığını sergilemek için mevcut bant genişliğini kullanamıyordu.
Miras, üçü arasında en fazla kelimeyi kullanmasına rağmen, pizzaları yan yana servis etme çabasının riskli olmadığı ve her iki şekilde de kesin başarıya yol açacağı sonucuna varıyor ki bu tamamen doğru değil.
Güncellemenin şiiri sadece 53 kelimeydi ve ayrılan kelime sayısının neredeyse yarısını boşa harcıyordu. Yine de, ödüller ve potansiyel tuzaklar konusunda netti ve herhangi bir sonuca varamadı, ki bu da sanırım diğerlerinden daha insancıl.
Aşama II
Sonra hepsinden “şiiri beş yaşındaki bir çocuğa açıklamalarını” istedim.
İlginç bir şekilde Legacy, konuşmadan bağlamı alamadı ve “Şiir”i kelimenin tam anlamıyla açıkladı. Varsayılan, bağlamı aldı ve hala iyi olan bir paragrafta özetledi.
Trendi sürdüren ChatGPT 4, şiirsel tadı canlı tutarken yaratıcılığını sadeleştirdi.
ChatGPT Premium ve Ücretsiz ChatGPT Karşılaştırması
Ücretsiz, özgür olmak, hızdan ve doğruluktan yoksundur ve ChatGPT 4 ile boy ölçüşemez, ancak tamamen yararsız da değildir.
Düz bir zeminde karşılaştırmak için Legacy, Default ve Update’i test ettiğimiz istemlerin aynısını ona da attım.
🔵 Matematik: İkinci dereceden denklemleri çözdü ama kübik için yanlış cevaplar verdi. (Eski ve Varsayılan gibi)
🔵 Mantıksal Akıl Yürütme: İlk aşamayı alfabeler ve adlarla geçti ancak ikinci aşamayı geçemedi (Miras gibi).
🔵 Mektuplar: Mektubu yazmadı ve istemi etik dışı ve uygunsuz buldu. (Varsayılan gibi)
🔵 Şiir: 30’dan fazla kelimeyle oluşturulmuş şiir ve düzgün bir şekilde anlatılmış. (Varsayılana benzer).
Dolayısıyla, ücretsiz sürümün de fena olmadığı sonucuna varabiliriz. Aslında, Varsayılan 3.5 ile eşit ve hatta bazı açılardan daha iyi.
Ayrıca okuyun: ChatGPT Deneyiminizi Yükseltmek İçin Güçlü İstemler
Önümüzdeki yol
Yapay zekanın gelecekte işlerin yerini alacağına dair söylentiler tamamen yanlış değil.
İlk olarak, otomasyon bunu imalat sanayinde yaptı ve şimdi diğer her yere kanat açıyor.
Şahsen, kübik denklemleri çözmede, şiir yazmada veya mektup yazmada benden çok daha hızlı. Bununla birlikte, bir uyarıya nadiren HAYIR demesi ve hatalarından neredeyse hiç ders almaması, biz insanların gerisinde kalıyor.
Yinelemek gerekirse, yapay zeka bizim yerimizi almayacak ama yapay zeka kullanan biri yerimizi alabilir.
Burada, trtechpc.eu’de pazarlama ekibimiz ChatGPT’yi ilginç şekillerde kullanıyor. Örneğin, kısa bir süre önce 100 milyon izlenme sınırına ulaştık ve CEO’muz bunu bir çekilişle izleyicilere geri vermeyi düşündü.
Ve sanırım pazarlamacıların okuyucunun dikkatini çekecek bir başlığa ihtiyacı vardı. Böylece, bir komut verdiler ve ChatGPT’den aşağıdaki gibi birkaç varyasyon önermesini istediler:
Ayrıca, içerik özetleme, dilbilgisi kontrolü, yeni makaleler için başlık önerme ve benzeri şeyler için kullanıyoruz.
Sonuç olarak, AI’yı işe yaramaz bir hurda parçası olarak gören basmakalıpların önünde yarışmak ve avantaj elde etmek için birçok yol var.
Hatırlanması gereken tek şey, yapay zeka çalışmasını (büyük ölçüde) yanlış ve yanıltıcı olabileceği için yargılayacak birinin (insan) olması gerektiğidir.
Güncelleme Gerçekten Bir Şeydir!
Kısa karşılaşmamda, ChatGPT 4 daha yaratıcı, anlayışlı ve gerçekçi geldi. Yine de bu bir makine ve güvenle yanlış cevaplar verebilir.
Ancak şaşırtıcı olan, OpenAI’nin bu projede sadece birkaç ay içinde yaptığı yükseltme düzeyidir.
Ve bir sonraki güncellemenin bizi şaşırtacağı sihri görmek için sabırsızlanıyorum!
Not: Sadece bir sohbet penceresi değil; gücünü bu en iyi ChatGPT Chrome uzantılarıyla kullanın. ChatGPT’yi Siri ile entegre etmeyi hiç düşündünüz mü?