NVIDIA Riva

NVIDIA Riva es un framework de aplicaciones para servicios de IA conversacional y multimodal que ofrecen rendimiento en tiempo real en las GPUs.

Webinar Introductorio??Registrarse en el Programa Beta

Riva es un framework de aplicaciones totalmente acelerado para la creaciÃ³n de servicios de IA conversacional y multimodal que utilizan un proceso de deep learning integral. Los desarrolladores pueden ajustar fÃ¡cilmente modelos de vanguardia con sus datos para lograr una comprensiÃ³n mÃ¡s profunda de su contexto especÃfico y optimizar asÃ la inferencia, a fin de ofrecer servicios integrales en tiempo real, que se ejecutan en menos de 300 milisegundos (ms) y ofrecen un rendimiento 7 veces mayor en las GPU en comparaciÃ³n con las CPU.

El framework Riva incluye modelos de IA conversacional previamente entrenados, el kit de herramientas de IA de NVIDIA y servicios optimizados e integrales extremo para tareas de habla, visiÃ³n y comprensiÃ³n de idiomas naturales (NLU).

La fusiÃ³n de la visiÃ³n, el audio y otras entradas de sensores de forma simultÃ¡nea proporciona capacidades tales como conversaciones multiusuario y multicontextuales en aplicaciones como asistentes virtuales, agendas multiusuario y asistentes de centros de llamadas.

Las aplicaciones basadas en Riva se han optimizado para maximizar el rendimiento de la plataforma NVIDIA EGX? en el cloud, el data center y el edge.

Rendimiento en Tiempo Real

Ejecuta aplicaciones de IA conversacional basadas en deep learning en menos de 300 ms, el umbral de latencia para el rendimiento en tiempo real.

Multimodal

Fusiona el habla y la visiÃ³n para ofrecer interacciones precisas y naturales en asistentes virtuales, chatbots y otras aplicaciones de IA conversacional.

ImplementaciÃ³n Automatizada

Usa un comando para implementar servicios de IA conversacional en el cloud o el edge.

â€œPing An aborda millones de consultas de los clientes cada dÃa mediante agentes de bots de chat. Como socios iniciales del programa de acceso temprano de Riva, pudimos usar las herramientas y crear mejores soluciones con mayor precisiÃ³n y menor latencia, proporcionando asÃ mejores servicios. MÃ¡s especÃficamente, con NeMo, el modelo pre-entrenado, y la canalizaciÃ³n ASR optimizada con Riva, el sistema logrÃ³ una mejora del 5% en la precisiÃ³n, a fin de brindar un mejor servicio a nuestros clientes.â€

â€” Dr. Jing Xiao, CientÃfico Jefe de Ping An

Crear Modelos de Deep Learning de Vanguardia

Figura 1: Modelos previamente entrenados

Usa modelos de deep learning de Ãºltima generaciÃ³n capacitados durante mÃ¡s de 100,000 horas en los sistemas NVIDIA DGX? para tareas de habla, comprensiÃ³n de idiomas y visiÃ³n. Los modelos y scripts previamente entrenados que se utilizan en Riva estÃ¡n disponibles gratuitamente en NGC?.

YouPuede ajustar estos modelos para su dominio con sus datos utilizando NVIDIA NeMo y el Kit de Herramientas Transfer Learning para implementarlos fÃ¡cilmente como servicios.

Desarrollar Nuevas Habilidades Multimodales

Desarrolla habilidades multimodales como la transcripciÃ³n de varios hablantes, chatbots, reconocimiento de gestos y mirar para hablar para tus aplicaciones de IA conversacional.

Riva incluye muestras de varias habilidades que puedes personalizar para tu caso de uso. Con Riva, puedes usar procesos de voz, comprensiÃ³n de idiomas y visiÃ³n junto con un administrador de diÃ¡logo que admite mÃºltiples usuarios y contextos para crear nuevas habilidades.

Figura 2: AplicaciÃ³n multimodal con mÃºltiples usuarios y contextos

Servicios Optimizados para Tareas EspecÃficas

Figura 3: Servicios de IA en Riva

Accede a servicios de alto rendimiento para tareas como reconocimiento de voz, reconocimiento de intenciÃ³n, conversiÃ³n de texto a voz, estimaciÃ³n de pose, detecciÃ³n de mirada y detecciÃ³n de puntos de referencia faciales a travÃ©s de una API simple.

Los procesos tuberÃas de cada habilidad se pueden fusionar para desarrollar nuevas habilidades. Cada proceso se ajusta al rendimiento para ofrecer el mayor rendimiento posible y se puede personalizar para tu caso de uso especÃfico.

Desarrollar e Implementar Servicios FÃ¡cilmente

Automatiza los pasos que van desde modelos previamente entrenados hasta servicios optimizados implementados en el cloud, el data center y el edge. En segundo plano, Riva aplica potentes optimizaciones de NVIDIA? TensorRT? a los modelos, configura el Servidor de Inferencia NVIDIA Triton?, y expone los modelos como un servicio a travÃ©s de una API estÃ¡ndar.

Para implementarlo, puedes usar un solo comando para descargar, configurar y ejecutar la aplicaciÃ³n Riva completa o servicios individuales a travÃ©s de plantillas de Helm en clÃºsteres de Kubernetes. Las plantillas de Helm se pueden personalizar para tu caso de uso y configuraciÃ³n especÃficos.