Posts by Yao (Jason) Lu
計算機視覺/視頻分析
2024年 5月 3日
基于 VILA 的 NVIDIA 硬件可視化語言模型
視覺語言模型最近有了顯著的發展。然而,現有技術通常僅支持一個圖像。他們無法在多個圖像之間進行推理、支持上下文學習或理解視頻。此外,
3 MIN READ
計算機視覺/視頻分析
2024年 5月 3日
視覺語言智能與 Edge AI 2.0
VILA 是 NVIDIA Research 和麻省理工學院共同開發的一系列高性能視覺語言模型。這些模型的參數規模從 ~3B 到 ~40B…
3 MIN READ