OpenAI, yapay zeka dünyasında yeni bir periyodun kapılarını aralayarak daha karmaşık problemleri çözme yeteneğine sahip olan OpenAI o1-Preview modelini tanıttı. Bu yeni modelde kullanıcılarına daha fazla düşünme müddeti ayırarak akıl yürütme hünerlerini geliştiren bir yaklaşım sunuyor.
Özellikle bilim, kodlama ve matematik alanlarında öne çıkan OpenAI o1, evvelki modellere kıyasla çok daha zorlayıcı sorunları çözebiliyor. Bu yeni model serisinin ön gösterim versiyonunu 12 Eylül 2024 prestijiyle ChatGPT ve API kullanıcılarının kullanımına sundu.
OpenAI, o1 serisi yapay zeka modelini duyurdu!
OpenAI o1-Preview modeli, yapay zekanın daha derin düşünme süreçlerine odaklanması için özel olarak eğitildi. Tıpkı bir insanın karmaşık bir sorunu çözmeye çalışırken farklı stratejiler denemesi üzere bu model de probleme daha fazla vakit ayırarak çeşitli tahlil yolları deniyor.
Eğitim sırasında yanılgılarını tanıma ve bu kusurlardan ders çıkarma yeteneği kazandığı için daha hakikat ve emniyetli sonuçlar üretiyor. Yapılan testlerde bu yeni model güçlü fizik, kimya ve biyoloji vazifelerinde yüksek performans sergiledi.
Özellikle Uluslararası Matematik Olimpiyatı (IMO) için yapılan eleme imtihanında evvelki model GPT-4o yalnızca %13 muvaffakiyet gösterirken, o1 serisi modeller yüzde 83 muvaffakiyet oranına ulaştı. Yani yeni model matematiksel akıl yürütme konusundaki yeteneklerde değerli bir sıçrama gerçekleştirdi. Kodlama alanında yapılan değerlendirmelerde de o1 serisi Codeforces yarışlarında yüzde 89’luk başarı oranına ulaştı.
OpenAI o1-Preview şimdi tam manasıyla donanımlı olmasa da karmaşık akıl yürütme misyonlarında kıymetli bir gelişme sunuyor. Ama ChatGPT’nin web tarayıcısı üzerinden bilgi edinme, evrak yükleme üzere kimi yeteneklerine şimdi sahip değil.
Ancak bu eksik özelliklerin ilerleyen devirdeki güncellemelerle eklenecek. OpenAI da o1 serisinin güçlü bir akıl yürütme yeteneği sunduğunu belirterek bu seriyi geliştirdiklerini ve gelecekte daha da yetenekli hale getirmeyi hedeflediklerini açıkladı.
Bu yeni model serisiyle birlikte güvenlik de en ön planda tutulmuş durumda. OpenAI, o1 serisini geliştirirken güvenlik kurallarına ahenk konusunda yeni bir eğitim sistemi uyguladı. Yapılan güvenlik testlerinde GPT-4o kullanıcıları güvenlik kurallarını aşmaya yönelik teşebbüslerinde yüzde 22 oranında muvaffakiyet gösterirken o1-preview modeli bu testlerden yüzde 84 muvaffakiyet oranıyla geçti.
OpenAI, bu yeni yeteneklere uygun bir biçimde güvenlik tedbirlerini ve işleyişini de geliştirdi. ABD ve Birleşik Krallık AI Güvenlik Enstitüleri ile yapılan mutabakatlar yapay zekanın güvenliğini sağlama konusunda büyük bir adım. Bu iş birliği sayesinde o1 serisinin araştırma versiyonlarına bu enstitüler öncelikli erişim sağladı.
OpenAI o1 serisi bilhassa bilim, kodlama ve matematik üzere karmaşık sorun çözme alanlarında çalışan profesyoneller için tasarlandı. Sıhhat araştırmacılarının hücre dizilim datalarını tahlil etmelerine yardımcı olabilirken, fizikçilerin kuantum optiği üzere şiddetli bahislerde karmaşık matematiksel formüller üretmesine imkan tanıyor.
Ayrıca yazılım geliştiricileri için çok adımlı iş akışlarını oluşturma ve yürütme süreçlerini kolaylaştırıyor. Kodlama konusunda güçlü bir yetenek sunan o1 serisi yanılgı ayıklama ve karmaşık kodları hakikat bir formda üretme hüneriyle öne çıkıyor.
Bununla birlikte OpenAI o1 serisinin daha süratli ve daha ekonomik bir versiyonu olan OpenAI o1-mini de tanıtıldı. o1-mini, kodlama alanında güçlü bir performans sergilerken, o1-preview modeline nazaran %80 daha ucuz ve daha süratli tahliller sunuyor. o1-mini, geniş dünya bilgisi gerektirmeyen lakin mantıksal akıl yürütme gerektiren uygulamalar için ülkü.
OpenAI o1 ve o1-mini modelleri ChatGPT Plus ve Team kullanıcıları için bugünden itibaren erişilebilir durumda. Kullanıcılar ChatGPT’de model seçiciden bu iki modeli manuel olarak seçebilecekler. Birinci basamakta o1-preview için haftalık ileti hududu 30, o1-mini için ise 50 mesaj ile sonlandırılmış durumda. Fakat bu hudutlar test sürecinden sonra artırılacak.
Ayrıca ChatGPT Enterprise ve Edu kullanıcıları önümüzdeki haftadan itibaren bu modellere erişebilecekler. API kullanımında ise o1 modellerine erişim sağlayacak geliştiriciler için başlangıçta kimi sınırlamalar bulunuyor. API üzerinden kullanımda fonksiyon çağırma, sistem bildirileri takviyesi ve akış üzere özellikler şimdilik sunulmuyor. Lakin bu özelliklerin gelecekteki güncellemelerle genişletilmesi planlanıyor.
Son olarak, OpenAI o1 serisinin geliştirme süreci devam ederken ilerleyen vakitlerde bu modellere tarayıcı kullanma, evrak ve fotoğraf yükleme üzere özelliklerin eklenmesi bekleniyor. OpenAI, GPT serisinin gelişimine paralel olarak o1 serisini de daha yetenekli hale getirmek için çalışmalara devam edeceklerini belirtti.
o1’i sıkıntı bir matematik sorusuyla test edelim!
Soru:
n= 2120513664800790253539677313137965097135330918669739874876522884425419822192953572604543957853144550543299308528152782351004280540006585446163977609483042476127757655581165623971024036878498518274613105037866315442871254527494237734606519519702337833399
n,253 basamaklı 2 treoktogintilyon, 120 dooktogintilyon sayısı olmak üzere (3 üssü n) 8 sayısı veriliyor. Bu sayıya “a” diyelim, yani a=(3 üssü n) 8 olsun,
b=55801173123655464364858943795512606247545285081165701401920499187099710397571
77 basamaklı 55 kattuorvigintilyon, 801 trevigintilyon sayısı veriliyor. b asal olmayan bir tamsayıdır. b’nin farklı tüm asal çarpanları göz önüne alınıyor. b’nin farklı asal çarpanları a’yı tam bölen var mı varsa hangisi ya da hangileri listeleyebilir misiniz?
Cevap:
Verilen sorunda:
aaa sayısının asal çarpanları yalnızca 2 ve 3’tür zira:
bbb sayısının asal çarpanlarını inceleyelim:
bbb’nin sayıları toplamı:
5+5+8+0+1+1+7+3+1+2+3+6+5+5+4+6+4+3+6+4+8+5+8+9+4+3+7+9+5+5+1+2+6+0+6+2+4+7+5+4+5+2+8+5+0+8+1+1+6+5+7+0+1+4+0+1+9+2+0+4+9+9+1+8+7+0+9+9+7+1+0+3+9+7+5+7+15 + 5 + 8 + 0 + 1 + 1 + 7 + 3 + 1 + 2 + 3 + 6 + 5 + 5 + 4 + 6 + 4 + 3 + 6 + 4 + 8 + 5 + 8 + 9 + 4 + 3 + 7 + 9 + 5 + 5 + 1 + 2 + 6 + 0 + 6 + 2 + 4 + 7 + 5 + 4 + 5 + 2 + 8 + 5 + 0 + 8 + 1 + 1 + 6 + 5 + 7 + 0 + 1 + 4 + 0 + 1 + 9 + 2 + 0 + 4 + 9 + 9 + 1 + 8 + 7 + 0 + 9 + 9 + 7 + 1 + 0 + 3 + 9 + 7 + 5 + 7 + 15+5+8+0+1+1+7+3+1+2+3+6+5+5+4+6+4+3+6+4+8+5+8+9+4+3+7+9+5+5+1+2+6+0+6+2+4+7+5+4+5+2+8+5+0+8+1+1+6+5+7+0+1+4+0+1+9+2+0+4+9+9+1+8+7+0+9+9+7+1+0+3+9+7+5+7+1
Bu sayıların toplamı 340’tır. 340 sayısı 3’e tam parçalanamaz (340 ÷ 3 = 113, kalan 1). Hasebiyle, bbb sayısı 3’e tam parçalanamaz.
Sonuç olarak, bbb sayısının asal çarpanları ortasında 2 yahut 3 bulunmaz. Bu da bbb’nin asal çarpanlarının aaa sayısını tam bölmediği manasına gelir.
Cevap: Hayır, bbb sayısının asal çarpanları aaa sayısını tam bölmez; yani ortak asal çarpanları yoktur.
Hayır, bbb sayısının asal çarpanlarından hiçbiri aaa sayısını tam bölmez; yani ortak asal çarpanları yoktur.
ChatGPT 4o zorlandı!
Aynı soruyu OpenAI’ın bilinen en zeki modeli ChatGPT 4o’ya sorduğumuzda ise cevap vermeden evvel uzunca bir müddet düşündü ve daha fazla vakit harcamak istemeyerek kısa yoldan çözmek istediğini söyledi.
Fakat nihayetinde benzeri bir karşılık verdi. Natürel bu sadece bizim yaptığımız kolay bir test. Lakin sorduğumuz matematik sorusu bizlere o1’in süreçleri yapmada çok daha süratli olduğunu, sonucu ayrıntılı formda adım adım net bir halde paylaştığını ve matematik hesaplamalarında 4o’dan daha uygun olduğunu gösterdi.
Apple Intelligence’ın ürettiği birinci manzara ortaya çıktı!
Veri politikasındaki amaçlarla sınırlı ve mevzuata uygun şekilde çerez konumlandırmaktayız. Detaylar için veri politikamızı inceleyebilirsiniz.