Haberler


Meta’dan Yapay Zekada Yeni Hamle: Görsel Algı, Dil Anlama ve Robotikte Çığır Açan Modeller Tanıtıldı

Meta Platforms (NASDAQ:META), makine algısı, dil işleme ve robotik alanlarında önemli bir sıçrama niteliğinde olan yeni yapay zeka modellerini duyurdu. Bu gelişme, şirketin yapay zeka yeteneklerini farklı disiplinlerde ileri taşıma stratejisinin bir parçası olarak değerlendiriliyor.

Tanıtılan modeller arasında Perception Encoder, Perception Language Model (PLM), Meta Locate 3D, Dynamic Byte Latent Transformer ve Collaborative Reasoner yer alıyor. Her biri, kendi alanındaki karmaşık görevleri çözmek için özel olarak geliştirildi.

Görsel Algıda Derin Yorumlama: Perception Encoder

Perception Encoder, görüntü ve videolardaki bilgiyi yorumlayabilme kabiliyetiyle dikkat çekiyor. Model, sıfır atışlı sınıflandırma ve erişim görevlerinde mevcut sistemleri geride bırakarak; örneğin doğal ortamlarda hayvanları tanımlamak gibi yüksek zorluktaki görevlerde başarı gösterdi. Büyük dil modelleriyle entegre edildiğinde, çok modlu görevlerde performans artışı da sağlıyor.

PLM ve VideoBench ile Görüntü-Dil Anlamada Yeni Standart

Meta’nın Perception Language Model (PLM) adlı açık kaynaklı modeli, insan etiketli ve sentetik verilerle eğitildi. 8 milyar parametreye kadar çıkan versiyonları ile karmaşık görsel tanıma görevlerini çözebiliyor. Meta, bu modelle birlikte PLM-VideoBench adlı yeni bir kıyaslama aracını da duyurdu. Bu araç, ayrıntılı aktivite anlama ve uzamsal-zamansal akıl yürütme üzerine odaklanıyor.

Robotikte 3D Anlayış: Meta Locate 3D

Meta Locate 3D, robotik alanında öne çıkan modellerden biri. Bu model, robotların doğal dil komutlarıyla 3 boyutlu ortamları yorumlamalarını ve etkileşim kurmalarını sağlıyor. Robotların, nesneleri 3D ortamda doğru şekilde konumlandırmasına olanak tanıyan model, daha otonom ve akıllı robot sistemlerine geçişte önemli bir adım olarak değerlendiriliyor. Ayrıca, Meta bu modelle birlikte 130.000 dil açıklaması içeren bir veri seti de paylaştı.

Verimlilik Odaklı Yeni Mimari: Dynamic Byte Latent Transformer

Meta’nın yeni bayt düzeyindeki dil modeli mimarisi, Dynamic Byte Latent Transformer, dil işlemeyi daha verimli ve sağlam hale getirmeyi hedefliyor. Geleneksel belirteç tabanlı modellerle eşdeğer sonuçlar veren bu model, 2024’te yayımlanan araştırmaların ardından topluluk kullanımına sunuldu.

İşbirlikçi Yapay Zeka: Collaborative Reasoner

Son olarak tanıtılan Collaborative Reasoner, çok adımlı akıl yürütme ve çok turlu konuşma içeren görevlerde insanlarla ya da diğer yapay zekâ ajanlarıyla işbirliği yapabilen modellerin geliştirilmesine olanak tanıyor. Meta, bu alanda daha fazla araştırmayı teşvik etmek amacıyla veri üretim altyapısını ve modelleri açık kaynak olarak paylaştı.

Meta'nın bu gelişmiş yapay zekâ modellerini uygulamalarına entegre etmesiyle, daha yetenekli, akıllı ve çok yönlü yapay zekâ sistemleri birçok alanda hayatımıza entegre olacak gibi görünüyor.


📷 Görsel kaynağı: Reuters