Shubham Agrawal

Shubham Agrawal 是 NVIDIA 的 AI 開發者技術工程師,在 Metropolis 團隊工作。他專注于使用視覺語言模型 (VLM) 將基于生成式 AI 的解決方案引入行業。他之前的研究主要集中在醫療領域的計算機視覺。他擁有哥倫比亞大學計算機科學碩士學位和 NITK Surathkal 信息技術學士學位。

Posts by Shubham Agrawal

計算機視覺/視頻分析

使用 NVIDIA AI Blueprint 構建實時多模態 XR 應用以進行視頻搜索和摘要

隨著 生成式 AI 和視覺基礎模型的最新進展,VLM 呈現了新一波視覺計算浪潮,其中模型能夠實現高度復雜的感知和深度上下文理解。 2 MIN READ
計算機視覺/視頻分析

圖像和視頻理解的視覺語言模型提示工程實踐指南

視覺語言模型 (VLMs) 正在以極快的速度發展。2020 年,首批 VLMs 通過使用視覺編碼器將視覺理解引入大語言模型 (LLMs) , 4 MIN READ
計算機視覺/視頻分析

NVIDIA TAO 5.5 帶來新基礎模型和增強訓練功能

NVIDIA TAO 是一個旨在簡化和加速 AI 模型開發和部署的框架。它使您能夠使用預訓練模型,使用自己的數據微調模型, 3 MIN READ