Google, yeni nesil büyük dil modeli PaLM 2'yi piyasaya sürdü
Google; çok dilli, kod yazabilen ve muhakeme yeteneklerine sahip dil modelini piyasaya sürdü.
Google, OpenAI'nin ChatGPT'sine rakibi olan Google'ın güncellenmiş Bard sohbet aracını güçlendirecek ve şirketin bugün duyurduğu yeni AI özelliklerinin çoğu için temel model işlevi görecek PaLM 2'yi I/O etkinliğinde tanıttı. Dil modellerinin en gelişmiş versiyonunu 100'den fazla dili kapsayan çok dilli metin konusunda yoğun bir eğitim almanın sonucu, PaLM'nin yükseltilmiş sürümü, nüanslı metinleri anlamak, oluşturmak ve çevirmek için gelişmiş yeteneklere sahip.
Google; çok dilli, kod yazabilen ve muhakeme yeteneklerine sahip dil modelinin özelliklerini de açıkladı. Küçükten büyüğe sırasıyla Gecko, Otter, Bison ve Unicorn olarak sunulacak PaLM 2 deneyime açıldı.
DeepMind Başkan Yardımcısı Zoubin Ghahramani, Google'ın I/O sunumundan önce bir basın brifinginde, "Çalışmamızda fark ettiğimiz nokta, bunun boyutla alakası olmadığı, daha büyük olanın her zaman en iyisi olmadığı" açıklamasında bulunmuştu. "Aslında parametre sayımının, modellerin yetenekleri hakkında düşünmenin gerçekten yararlı bir yolu olmadığını ve yeteneklerin gerçekten modelleri kullanan kişiler tarafından değerlendirilmesi ve bu modellerle başarmaya çalıştıkları testlerde yararlı olup olmadıklarını öğrenmesi gerektiğini düşünüyoruz." diye devam etmişti.
Şirket bunun yerine yeteneklere odaklanmaya karar verdi. Google, yeni modelin sağduyu, matematik ve mantıkta daha iyi olduğunu söylüyor.
Aslında, Ghahramani'nin de belirttiği gibi, şirket PaLM 2 modelini büyük miktarda matematik ve fen metinlerinin yanı sıra matematiksel ifadeler üzerinde eğitti. Dile odaklanan büyük dil modellerinin, üçüncü taraf eklentilere başvurmadan matematik sorularınıkavramakta zorlandığını biliyoruz. Ancak Google, PaLM 2'nin matematik bulmacalarını kolayca çözebileceğini, problemler üzerinden akıl yürütebileceğini ve hatta diyagramlar sağlayabileceğini savunuyor.
PaLM 2 ayrıca artık kod yazmak ve hata ayıklamak için geliştirilmiş desteğe sahiptir. Bu model, JavaScript ve Python gibi popüler dillerin yanı sıra Prolog, Verilog ve Fortran gibi 20 programlama dilinde eğitildi. PaLM 2, Google'ın kodlama ve hata ayıklamaya yönelik özel modeli Codey'nin temelini oluşturuyor ve diğer şeylerin yanı sıra kod tamamlama ve oluşturma hizmetinin bir parçası olarak çıkıyor.
Google ayrıca PaLM 2'nin 100'den fazla dil içeren bir yapı üzerinde eğitildiğinin altını çizdi ve Google'ın deyimiyle önceki modellere göre daha incelikli ifadeler de dahil olmak üzere "çok dilli görevlerde mükemmel" hale geldi.
Google, PaLM'den Codey'nin beğenilerini ve aynı zamanda şirketin tıbbi bilgiye odaklanan modeli Med-PaLM 2'yi içeren bir model ailesi olarak bahsediyor.
Ayrıca, güvenlik durumlarına odaklanan Sec-PaLM ve akıllı telefonlarda çalışan daha küçük bir PaLM modeli de mevcut. Bu da potansiyel olarak PaLM'yi daha fazla gizlilik merkezli kullanım durumlarına açabilir. Google, bu modelin saniyede 20 token işleyebileceğini söylüyor, bu çok hızlı olmasa da gelecek vaat ediyor.