"OmniPredict" adı verilen bu sistem, insanların görsel ve bağlamsal ipuçlarını gerçek zamanlı olarak yorumlayarak niyetlerini anlama yeteneği sergiliyor.
Yayaların davranışlarını öngören yeni teknoloji
OmniPredict, yayaların nasıl davranacağını tahmin etmek için Çok Modlu Büyük Dil Modeli (MLLM) kullanan ilk sistem olma özelliğini taşıyor.
Gelişmiş sohbet botlarında ve görüntü tanıma teknolojilerinde kullanılan alt yapıyı temel alan sistem, gördüğü sahneleri bağlamsal detaylarla eşleştirerek bir kişinin bir sonraki adımda ne yapacağını önceden kestiriyor.
Projenin baş araştırmacısı Dr. Srikanth Saripalli, şehirlerin ve yayaların öngörülemez olduğunu belirterek, "Yeni modelimiz, makinelerin sadece olanı biteni görmediği, insanların ne yapacağını da tahmin ettiği bir geleceğe bakış sunuyor" ifadesini kullandı.
Sokak zekası ve insan benzeri sezgi
Otonom sürüşü daha güvenli hale getirmeyi amaçlayan bu model, araçlara insan benzeri bir sezgi kazandırıyor. Sistem, bir yayanın mevcut hareketine tepki vermek yerine, o kişinin karşıya geçip geçmeyeceğini veya duraksayıp duraksamayacağını analiz ediyor. Bu yaklaşım, özellikle yoğun kentsel ortamlarda otonom araçların daha akıcı ve güvenli hareket etmesini sağlayabilir.
Dr. Saripalli, bu teknolojinin sadece yaya kazalarını azaltmakla kalmayacağını, aynı zamanda tehlikeyi oluşmadan önleyen proaktif bir yaklaşıma geçişi temsil ettiğini vurguladı.
Karmaşık ortamlarda davranış analizi
Sistemin kullanım alanları sadece şehir içi yollarla sınırlı kalmıyor. OmniPredict; vücut duruşundaki değişiklikleri, tereddütleri veya stres belirtilerini okuyarak askeri operasyonlar ve acil durum müdahaleleri için de önemli bir araç olabilir. Tehdit oluşturabilecek davranışların erkenden tespit edilmesi, güvenlik personeline durumsal farkındalık ve hızlı karar verme yeteneği kazandırabilir.
Başarı testleri ve performans verileri
Geleneksel otonom sistemler, binlerce veri setiyle eğitilen bilgisayarlı görü modellerine dayanırken; OmniPredict, görsel algıyı davranışsal muhakeme ile birleştiriyor. Araştırmacılar, sistemi herhangi bir özel eğitim vermeden yaya davranışı araştırmalarındaki en zorlu veri setleri üzerinde test etti.
Computers & Engineering dergisinde yayımlanan sonuçlara göre, OmniPredict yüzde 67 doğruluk oranına ulaşarak en güncel modelleri yüzde 10 geride bıraktı. Yapay zeka, yayaların kısmen gizlendiği veya araca doğru baktığı karmaşık senaryolarda bile yüksek performans sergilemeye devam etti.





