Araştırma makalesine göre Apple ReALM adı verilen sistem, ekrandaki görsel öğelere yapılan atıfları (“bu” veya “şu” gibi) anlamak da dahil olmak üzere karmaşık referansları saf bir dil modelleme problemine dönüştürmek için büyük dil modellerinden yararlanıyor. Bu da ReALM’in mevcut yöntemlere kıyasla önemli performans kazanımları elde etmesini sağlıyor.
Yine de araştırmacılar, ekranların otomatik ayrıştırılmasına güvenmenin sınırlamaları olduğu konusunda uyarıyor. Birden fazla görüntü arasında ayrım yapmak gibi daha karmaşık görsel referansların ele alınması, muhtemelen bilgisayarla görü ve çok modlu tekniklerin dahil edilmesini gerektirecek.
Kirli mobilyalarınızı temizleyebileceğiniz, içecek veya yemek dökülen yerlere anında müdahale edebileceğiniz her bütçeye uygun halı ve koltuk yıkama makinelerini listeledik.
Microsoft tarafından geliştirilen ChatGPT’ye benzer Microsoft 365 Copilot adı verilen araç, kullanıcının toplantıya girememesi durumunda kişiye toplantıyı özetleyebilecek. Microsoft’un yeni yapay zekâ aracı, 1 Kasım’dan itibaren Office …