Yapay zeka, sudokuda rakiplerini yenmeyi başaramadı

Colorado Üniversitesi’nden bir araştırma ekibi, yapay zeka modellerinin güvenilirliğini test etmek amacıyla 6×6 formatında oluşturdukları 2.300 yeni Sudoku bulmacasını kullandı.

Yapılan testlerde, OpenAI’nin “o1” modeli en iyi performansı göstererek toplam bulmacaların yalnızca %65’ini doğru şekilde çözebildi. Diğer modellerde bu oran daha da düşük kaldı.

Yapay zeka modellerinin temel oyunlarda ve bulmacalarda başarısız olduğunu daha önce gördük. OpenAI’nin ChatGPT’si (ve diğerleri), 1979 tarihli bir Atari oyununda bilgisayar rakibi tarafından satrançta tamamen ezildi. Apple’ın yakın tarihli bir araştırma makalesi, modellerin Hanoi Kulesi gibi bulmacalarda zorlanabileceğini de ortaya koydu.

Yapay zekayı sohbet dışında çok zorlamayın

Sohbet robotları da satranç eğitimi olmadığı için kötü sonuçlar alabilir. Mantıklı hamleler bulurlar, ancak üç, dört veya beş hamle sonrasını düşünmezler. Bu, iyi satranç oynamak için gereken temel beceridir. Sohbet robotları ayrıca bazen satranç taşlarını kurallara uymayan veya onları anlamsız bir tehlikeye atan şekillerde hareket ettirme eğilimindedir.

Dolayısıyla, yapay zeka araçları, eğitimleri olmayan konularda ve şimdilik cevaplarını internette bulamayacakları detaylarda pek de başarılı sayılmazlar. Ama yakın gelecekte bunun da değişeceğine emin olabiliriz.

Related Posts

Yeni yöntemi duyurdular: ‘Kara deliğe 70 yılda gidebiliriz’

Çinli bilim insanları, ışık hızını aşmanın mümkün olmadığı göz önüne alındığında, kara deliklere ulaşmak için yeni bir yöntem önerdi. Fudan Üniversitesi’nden Astrofizik Profesörü Cosimo Bambi ve ekibi, ışık hızının sadece bir kısmına ulaşabilecek çok hafif uzay araçları tasarlamayı hesapladı. Bu araçlar, lazer ve ışık yelkeni teknolojileriyle güçlendirilecek.

Moto 360 geri dönüyor

2017 yılında üretimine son verilen Moto 360 serisi, 2025’te yeniden doğuyor. Android Headlines’ın yayınladığı görsellere göre, yeni model paslanmaz çelik gövdeye ve metal kayışa sahip. Saatin sağ tarafında, 2 yönünde konumlandırılmış bir döner taç ve …

Bilim dünyasına damga vuran deney! Casus arılar gerçek oldu

Çinli araştırmacılar tarafından arıların beyinlerine yerleştirilen küçük cihazlar sayesinde, arilar sibernetik organizmalar haline dönüştürüldü. arıların sırtına konumlandırılan ve küçük iğneler aracılığıyla doğrudan beyine bağlanılabilen bir …

Grok 4, cevaplarını Musk’ın görüşlerinden mi alıyor?

Elon Musk’ın yapay zekâ şirketi xAI, son modeli Grok 4’ü çarşamba gecesi tanıttı. Musk, canlı yayında yaptığı açıklamada, Grok 4’ün amacının “maksimum düzeyde gerçekleri arayan bir yapay zekâ” olduğunu söyledi. Ancak Grok 4’ün tartışmalı konulara yanıt verirken gerçeği nerede aradığı merak konusu oldu.

Grok hakkında erişim engeli kararı

Grok hakkında erişim engeli kararı

Apple, Çin’de düşüş eğiliminde olan iPhone satışlarını artırdı

Apple, ABD ve Çin arasındaki gerilimden en çok etkilenen şirketlerden biriydi. Özellikle iPhone, Çin’de uzun bir süredir ilk sırada satmıyor. Hatta milyonlarca kullanıcısını da kaybetmiş durumda. Ancak yeniden yükselişe geçti.