Breaking
21 Oct 2024, Mon

IBM, kurumsal yapay zekaya yönelik açık kaynaklı Granite 3.0 LLM’leri piyasaya sürüyor – Gazete İstanbul

IBM, kurumsal yapay zekaya yönelik açık kaynaklı Granite 3.0 LLM’leri piyasaya sürüyor – Gazete İstanbul


Sektör lideri yapay zeka kapsamına ilişkin en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin


Bu konuda yanılmayın, kurumsal yapay zeka büyük bir iştir, özellikle de IBM için.

IBM’in halihazırda üretken yapay zeka ile ilgili 2 milyar dolarlık bir iş defterine sahip ve şimdi bu büyümeyi hızlandırmanın yollarını arıyor. IBM, üçüncü nesil Granite büyük dil modellerinin (LLM’ler) piyasaya sürülmesiyle kurumsal yapay zeka işini bugün genişletiyor. Yeni neslin temel unsurlarından biri, gerçek açık kaynaklı kurumsal yapay zekaya sürekli odaklanılmasıdır. Bir adım daha ileri giderek IBM, InstructLab yetenekleriyle modellerin kurumsal yapay zekaya göre hassas şekilde ayarlanmasını sağlıyor.

Bugün açıklanan yeni modeller arasında 2 milyar ve 8 milyar Granite 3.0 ile genel amaçlı seçenekler yer alıyor. Ayrıca Granite 3.0 3B A800M Instruct, Granite 3.0 1B A400M Instruct, Granite 3.0 3B A800M Base ve Granite 3.0 1B A400M Base’i içeren Uzmanlar Karması (MoE) modelleri de bulunmaktadır. Güncellemeyi tamamlayan IBM, Granite Guardian 3.0 8B ve Granite Guardian 3.0 2B modellerini içeren optimize edilmiş korkuluk ve güvenlik seçeneklerine sahip yeni bir gruba da sahip. Yeni modeller IBM’in watsonX hizmetinin yanı sıra Amazon Bedrock, Amazon Sagemaker ve Hugging Face’te de satışa sunulacak.

IBM’in kıdemli başkan yardımcısı ve ticari baş sorumlusu Rob Thomas, “Son kazanç görüşmemizde de belirttiğimiz gibi, üretken yapay zeka üzerine inşa ettiğimiz iş hacmi artık teknoloji ve danışmanlık alanında 2 milyar doların üzerindedir” dedi. basın ve analistlerle brifing verdi. “IBM’deki 25 yılımı düşündüğümde, bu hızda büyüyen bir işimiz olduğundan emin değilim.”

IBM, Granite 3.0 ile kurumsal yapay zekayı nasıl geliştirmeyi hedefliyor?

Granite 3.0, kurumsal uygulamalar için özel olarak tasarlanmış bir dizi gelişmiş yapay zeka modelini sunar.

IBM, yeni modellerin müşteri hizmetleri, BT otomasyonu, İş Süreci Dış Kaynak Kullanımı (BPO), uygulama geliştirme ve siber güvenlik gibi çeşitli kurumsal kullanım senaryolarını desteklemeye yardımcı olmasını bekliyor.

Yeni Granite 3.0 modelleri, IBM’in eğitim için kullanılan verilerin kaynağından ve düzenlenmesinden sorumlu olan merkezi veri modeli fabrikası ekibi tarafından eğitildi.

IBM araştırma Kıdemli Başkan Yardımcısı ve Direktörü Dario Gil, eğitim sürecinin hem birden fazla dildeki dil verileri hem de kod verileri dahil olmak üzere 12 trilyon token veri içerdiğini açıkladı. Önceki nesillerden temel farklılıkların, verilerin kalitesi ve eğitim sürecinde kullanılan mimari yenilikler olduğunu vurguladı.

Thomas, verilerin nereden geldiğinin de bilinmesinin önemli olduğunu ekledi.

Thomas, “Mannequin oluşturmadaki avantajımızın bir kısmı da sahip olduğumuz ve IBM’e özgü veri kümeleridir” dedi. “Sektörde, ürettiğimiz her şeyin ilk müşterisi olduğumuz, aynı zamanda modelleri nasıl oluşturduğumuz açısından da bize avantaj sağlayan benzersiz bir bakış açısına sahip olduğumuzu söyleyebilirim.”

IBM, Granite 3.0 için yüksek performans kriterleri talep ediyor

Gil’e göre Granite modelleri, Google, Anthropic ve diğer modellerin en son sürümlerinden daha iyi performans göstererek çok çeşitli görevlerde dikkate değer sonuçlar elde etti.

Gil, “Burada gördüğünüz şey inanılmaz derecede yüksek performanslı, kesinlikle son teknoloji ürünü modeller ve biz bundan büyük gurur duyuyoruz” dedi.

Ancak Granite’i farklı kılan yalnızca ham performansı değildir. IBM aynı zamanda güvenliğe ve güvene de büyük önem veriyor ve temel modellerin jailbreak’lenmesini veya zararlı içerik üretmesini önlemek için kullanılabilecek gelişmiş “Guardian” modelleri geliştiriyor. Çeşitli mannequin boyutu seçenekleri de kritik bir unsurdur.

Gil, “Çok önemsiyoruz ve yapay zekayı ölçeklendirmekten çıkarım maliyetinin önemli olduğu yönünde bir ders aldık” dedi. “Mannequin kategorisinin boyutuna bu kadar odaklanmamızın nedeni budur; çünkü bu, kuruluştaki kullanım durumlarını ölçeklendirmek için çok cazip olan performans ve çıkarım maliyeti karışımına sahiptir.”

Kurumsal yapay zeka için gerçek açık kaynak neden önemlidir?

Granite 3.0’ı farklı kılan en önemli özellik, IBM’in modelleri Açık Kaynak Girişimi (OSI) onaylı Apache 2.0 açık kaynak lisansı kapsamında yayınlama kararıdır.

Piyasada, Meta’nın Llama’sı gibi, gerçekte OSI onaylı bir lisans kapsamında bulunmayan birçok başka açık mannequin bulunmaktadır. Bu, bazı işletmeler için önemli olan bir ayrımdır.

Gil, “Bu konuda kesinlikle internet olmaya karar verdik ve kurumsal ortaklarımıza teknolojiyle yapmaları gerekenleri yapmaları için maksimum esneklik sağlamak amacıyla Apache 2 lisansı almaya karar verdik” diye açıkladı.

İzin verilen Apache 2.0 lisansı, IBM’in ortaklarının Granite modellerinin üzerinde kendi markalarını ve fikri mülkiyetlerini oluşturmalarına olanak tanır. Bu, Granite teknolojisiyle desteklenen güçlü bir çözüm ve uygulama ekosisteminin geliştirilmesine yardımcı olur.

Thomas, “Katkıyı mümkün kılan, topluluğa olanak tanıyan ve sonuçta geniş dağıtıma olanak tanıyan izin veren bir lisansa sahip olduğunuzda, işletmelerin yapay zekayı ne kadar hızlı benimseyebileceği fikrini tamamen değiştiriyor” dedi.

Üretken yapay zekanın ötesinde üretken bilişime bakış

İleriye dönük olarak IBM, Gil’in üretken hesaplama olarak adlandırdığı bir sonraki büyük paradigma değişimini düşünüyor.

Temel olarak, üretken bilgi işlem, adım adım talimatları açıkça yazmak yerine, örnekler veya yönlendirmeler sağlayarak bilgisayarları programlama becerisini ifade eder. Bu, aldıkları girdiye göre metin, kod ve diğer çıktıları üretebilen Granite gibi LLM’lerin yetenekleriyle uyumludur.

Gil, “Talimatları yazmadığımız, ancak örnek olarak bilgisayarı programladığımız bu paradigma temeldir ve Yüksek Lisans’larla etkileşime girerek bunun nasıl bir his olduğuna yeni yeni dokunmaya başlıyoruz” dedi. “Bu üretken bilgi işlem paradigması ile yeni nesil modelleri, aracılı çerçeveleri ve bundan çok daha fazlasını uygulayabileceğimiz bir yönde yatırım yaptığımızı ve çok agresif bir şekilde ilerlediğimizi göreceksiniz; bu, temel olarak yeni bir şey. Nesil Yapay Zeka devriminin bir sonucu olarak bilgisayarları programlamanın bir yolu.”

By admin

Leave a Reply

Your email address will not be published. Required fields are marked *