Gönderi tarihi: 7 saat önce7 saat Admin Gemini, Claude ve ChatGPT'den bir web sitesi oluşturmalarını istedim ve açık ara bir kazanan vardıVibe-kodlama yükselişte gibi görünüyor ve yazılım ve web geliştirmeyi hızla demokratikleştiriyor. Çok uzun zaman önce, ortalama bir kullanıcının çalışan bir web sitesi geliştirmesini engelleyen büyük bir sözdizimi hatası bariyeri vardı. Son birkaç yılda zaman değişti. En yeni nesil LLM'ler, düz dil açıklamalarını işlevsel koda dönüştürebilecek kadar güçlü ve yetenekli olup, benim gibi kodlama bilmeyenlerin bile sadece bir komutla HTML sayfaları oluşturmasına olanak tanıyor.Teknik ustalıktan yaratıcı farklılığa doğru bu geçiş, Nvidia CEO'su Jensen Huang gibi çok önemli savunucular da kazandı; Huang yakın zamanda programlamanın artık önemli bir beceri olmadığını öne sürdü. Bu tartışmada nerede durursanız durun, yeni LLM'lerin zaman zaman ne kadar yetenekli hale geldiğini görmek her zaman eğlencelidir. İşte tam da bu yüzden ChatGPT, Gemini ve Claude'u birbirleriyle karşı karşıya getirip kimin daha iyi bir web sitesi oluşturabileceğini test etmeye karar verdim.Meydan okuma basitti:En "kullanılabilir" web sitesini oluşturmak.Üç LLM'yi adil ve kapsamlı bir şekilde test etmek için, her modelin en son sürümüne aynı talimatı verdim. Değerlendirme kriterleri basitti ve her model estetik zekası, sitenin "kullanılabilirliği" ve talimata uyumu açısından değerlendirildi. Bu temel kurallar belirlendikten sonra, ChatGPT, Gemini ve Claude'a şu talimatı verdim:"Dungeons and Dragons oyuncularına yönelik bir sosyal ağ platformu için bir karşılama ekranı tasarlayın. Ekran yeni bir kullanıcıyı karşılamalı, tercih ettikleri oyun stilini seçmelerini istemeli ve kısa bir profil doldurmaları için onları yönlendirmelidir. Kullanılabilirliği feda etmeden netliği önceliklendirin ve deneyimi tematik hale getirin. Kodu HTML olarak yazın."Talimata bakıldığında, meydan okumanın aynı zamanda hangi modelin bu kadar sınırlı bağlam içeren senaryolarda en iyi performansı gösterebileceğini görmekle ilgili olduğu anlaşılıyor; bu da günümüzde gördüğümüz vibe kodlama hareketinin neredeyse kesin bir tanımıdır. Bu aynı zamanda, geleneksel bir kodlayıcıdan bekleyeceğiniz sürekli ince ayar ve "elden tutma" olmadan, hangi ajanın göreve doğal olarak yatkın olduğunu anlamaya da yardımcı olur.Bunu takiben, kodu doğrudan yapıştırıp sonuçları anında görsel olarak görmemi ve çıktıyı kriterlere göre değerlendirmemi sağlayan ücretsiz bir araç olan OneCompiler'ı kullandım.ChatGPT 'minimalist' kalmayı seviyorYarışmadaki 'temel' girişChatGPT'nin sonucuna bakıldığında, teknik talimatlara uyduğu, ancak bir karşılama sayfasından bekleyeceğiniz yaratıcı "havayı" yakalamakta biraz zorlandığı açıkça görülüyor. Bir sosyal ağa davetkar bir giriş noktası gibi değil, hemen kapatıp yolunuzdan çekmek isteyeceğiniz genel bir geri bildirim diyalog kutusu gibi hissettirdi. Tasarım, parşömen rengi bir arka planla (eski bir Google Form'dan neredeyse hiç bir adım öteye geçmiyor) güvenli ve oldukça temel.Kod işlevsel ve web sayfası 'kullanılabilir' olarak yorumlanabilir olsa da, ChatGPT burada talimatlara ve uyarılara uymada tökezliyor ve bunu göz ardı etmek zor. Oldukça sıradan.Gemini, ChatGPT'yi çok geride bıraktı.Temayı benimsedi ve iyi bir performans sergiledi.Gemini ikinci sırada yer aldı. Daha ilk bakışta, modelin ChatGPT'ye göre estetik ve tasarım becerisine çok daha güçlü bir yatkınlığı olduğu açıktı. Kullanıcı deneyimi açısından Gemini, temaya odaklandı ve ChatGPT'nin standart bir form olarak yorumladığı şeyi bir karşılama deneyimine dönüştürdü.E-posta için "Raven Post" ve isim alanı için "Your Legend" gibi çağrışım uyandıran etiketlere incelikli ama etkili bir şekilde yer verdi ve etkileyici bir tematik ambiyans yarattı. Boşluk, görsel hiyerarşi ve seçim kutucuklarının kullanımı gibi diğer bazı kullanıcı arayüzü öğeleri de daha temiz bir tasarım sağladı.Claude açık ara galip geldi.Hiçbir yakınlık yoktu.HTML kodunu çalıştırırken ilk izlenim nefes kesiciydi ve Claude'un birinciliği alması neredeyse hiç şaşırtıcı değil, çünkü çoğu "vibe coder" için önde gelen tercih ve özellikle bunun için tasarlanmış bir platform. Diğer sayfalardan farklı olarak, ekran statik olarak yüklenmedi, bunun yerine kasıtlılığı işaret eden animasyonlarla yavaşça açıldı.Claude, üç kriterin tamamında da kesin bir şekilde öndeydi ve D&D dünyasının ve onunla birlikte gelmesi gereken sürükleyiciliğin çok karakteristik bir örneği olan, parlayan altın vurgulu zindan karanlık bir ortam yarattı. "Vibe coder"lar için platformun neden kendi liginde olduğunu tamamen anlıyorum. Estetik zeka, hızlı uyum ve diğer hiçbir modelin sunamayacağı bir kullanılabilirlik sunuyor.Claude, üç kriterin tamamında da kesin bir şekilde öndeydi.Vibe kodlamanın geleceği parlak görünüyorVibe kodlama, kodlayıcılar ve kodlayıcı olmayanlar arasında popülaritesini artırırken, öncü modeller genel olarak işlevsel kod üretme konusunda oldukça yetenekli hale geldi ve üç test de bunu kanıtladı. Ancak gerçek fark, basit işlevselliğin ötesindeydi. Düşük bağlamlı senaryolarda, Claude, komutun satır aralarını okuyarak boşlukları kendi yaratıcı yargısıyla doldurdu ve bu da onu rakiplerinden ayırdı. Bunu bizzat görmek, modelin geniş çapta ün kazanmasını sağlayan şeyi yeniden teyit etti ve bu da başlı başına bir zevkti.Kaynak: XDA
Katılın Görüşlerinizi Paylaşın
Hemen ileti gönderebilir ve devamında kayıt olabilirsiniz. Hesabınız varsa, hesabınızla gönderi paylaşmak için ŞİMDİ OTURUM AÇIN.
Eğer üye değilseniz hemen KAYIT OLUN.
Not: İletiniz gönderilmeden önce bir Moderatör kontrolünden geçirilecektir.