Yapay zeka, sudokuda rakiplerini yenmeyi başaramadı

Colorado Üniversitesi’nden bir araştırma ekibi, yapay zeka modellerinin güvenilirliğini test etmek amacıyla 6×6 formatında oluşturdukları 2.300 yeni Sudoku bulmacasını kullandı.

Yapılan testlerde, OpenAI’nin “o1” modeli en iyi performansı göstererek toplam bulmacaların yalnızca %65’ini doğru şekilde çözebildi. Diğer modellerde bu oran daha da düşük kaldı.

Yapay zeka modellerinin temel oyunlarda ve bulmacalarda başarısız olduğunu daha önce gördük. OpenAI’nin ChatGPT’si (ve diğerleri), 1979 tarihli bir Atari oyununda bilgisayar rakibi tarafından satrançta tamamen ezildi. Apple’ın yakın tarihli bir araştırma makalesi, modellerin Hanoi Kulesi gibi bulmacalarda zorlanabileceğini de ortaya koydu.

Yapay zekayı sohbet dışında çok zorlamayın

Sohbet robotları da satranç eğitimi olmadığı için kötü sonuçlar alabilir. Mantıklı hamleler bulurlar, ancak üç, dört veya beş hamle sonrasını düşünmezler. Bu, iyi satranç oynamak için gereken temel beceridir. Sohbet robotları ayrıca bazen satranç taşlarını kurallara uymayan veya onları anlamsız bir tehlikeye atan şekillerde hareket ettirme eğilimindedir.

Dolayısıyla, yapay zeka araçları, eğitimleri olmayan konularda ve şimdilik cevaplarını internette bulamayacakları detaylarda pek de başarılı sayılmazlar. Ama yakın gelecekte bunun da değişeceğine emin olabiliriz.

Related Posts

Mars’tan gelen yeni harika: Perseverance’tan 360 derecelik panoramik fotoğraf

NASA’nın Mars gezgini Perseverance, Mastcam-Z kameralarıyla çekilen ve 360° görüş sunan en net panoramalardan birini gönderdi.

BioShock 4’te büyük kriz

BioShock 4’ün geliştirme sürecinde yaşanan ciddi aksaklıklar, oyun dünyasında büyük yankı uyandırdı. Take-Two ve 2K’nın yaptığı kritik değerlendirme sonucu oyunun hikayesinde ve yönetim kadrosunda köklü değişikliklere gidildiği ortaya çıktı …

Genç bir yıldızın etrafında yaşamın yapıtaşları bulundu

Bilim insanları, dünya dışı yaşamın kökenlerine dair ipuçları sunabilecek karmaşık organik molekülleri, genç bir yıldızın etrafındaki diskte tespit etti.

120 bin araç geri çağırılacak

NHTSA, Stellantis’in 120 binden fazla ABD aracını baş destekleri sorunu bedeniyle geri çağıracağını açıkladı.

Google’dan Android kullanıcılarını şaşkına çeviren adım

Dünya genelinde milyonlarca kişi tarafından kullanılan Google Maps, Android cihazlardaki kullanıcı deneyimini önemli ölçüde etkileyen bir değişiklik yaptı. Navigasyon sırasında müzik dinlemeyi kolaylaştıran medya kontrol butonu, Android sürümünde …

Güneş Sistemi’ne uğrayan en büyük yıldızlararası cisim keşfedildi

Güneş Sistemi dışından gelen gökcisimleri ender görülüyor, ancak bu hafta bilim insanları büyük bir heyecan yaşadı. Gökbilimciler, 3I/Atlas adı verilen yeni bir kuyruklu yıldızın yıldızlararası uzaydan geldiğini ve şu anda Güneş Sistemi’nden geçmekte olduğunu doğruladı.