NVIDIA Riva
NVIDIA Riva es un framework de aplicaciones para servicios de IA conversacional y multimodal que ofrecen rendimiento en tiempo real en las GPUs.
Riva es un framework de aplicaciones totalmente acelerado para la creación de servicios de IA conversacional y multimodal que utilizan un proceso de deep learning integral. Los desarrolladores pueden ajustar fácilmente modelos de vanguardia con sus datos para lograr una comprensión más profunda de su contexto especÃfico y optimizar asà la inferencia, a fin de ofrecer servicios integrales en tiempo real, que se ejecutan en menos de 300 milisegundos (ms) y ofrecen un rendimiento 7 veces mayor en las GPU en comparación con las CPU.
El framework Riva incluye modelos de IA conversacional previamente entrenados, el kit de herramientas de IA de NVIDIA y servicios optimizados e integrales extremo para tareas de habla, visión y comprensión de idiomas naturales (NLU).
La fusión de la visión, el audio y otras entradas de sensores de forma simultánea proporciona capacidades tales como conversaciones multiusuario y multicontextuales en aplicaciones como asistentes virtuales, agendas multiusuario y asistentes de centros de llamadas.
Las aplicaciones basadas en Riva se han optimizado para maximizar el rendimiento de la plataforma NVIDIA EGX? en el cloud, el data center y el edge.
Rendimiento en Tiempo Real
Ejecuta aplicaciones de IA conversacional basadas en deep learning en menos de 300 ms, el umbral de latencia para el rendimiento en tiempo real.
Multimodal
Fusiona el habla y la visión para ofrecer interacciones precisas y naturales en asistentes virtuales, chatbots y otras aplicaciones de IA conversacional.
Implementación Automatizada
Usa un comando para implementar servicios de IA conversacional en el cloud o el edge.
“Ping An aborda millones de consultas de los clientes cada dÃa mediante agentes de bots de chat. Como socios iniciales del programa de acceso temprano de Riva, pudimos usar las herramientas y crear mejores soluciones con mayor precisión y menor latencia, proporcionando asà mejores servicios. Más especÃficamente, con NeMo, el modelo pre-entrenado, y la canalización ASR optimizada con Riva, el sistema logró una mejora del 5% en la precisión, a fin de brindar un mejor servicio a nuestros clientes.â€
— Dr. Jing Xiao, CientÃfico Jefe de Ping An
![]()
Crear Modelos de Deep Learning de Vanguardia
Usa modelos de deep learning de última generación capacitados durante más de 100,000 horas en los sistemas NVIDIA DGX? para tareas de habla, comprensión de idiomas y visión. Los modelos y scripts previamente entrenados que se utilizan en Riva están disponibles gratuitamente en NGC?.
YouPuede ajustar estos modelos para su dominio con sus datos utilizando NVIDIA NeMo y el Kit de Herramientas Transfer Learning para implementarlos fácilmente como servicios.
Desarrollar Nuevas Habilidades Multimodales
Desarrolla habilidades multimodales como la transcripción de varios hablantes, chatbots, reconocimiento de gestos y mirar para hablar para tus aplicaciones de IA conversacional.
Riva incluye muestras de varias habilidades que puedes personalizar para tu caso de uso. Con Riva, puedes usar procesos de voz, comprensión de idiomas y visión junto con un administrador de diálogo que admite múltiples usuarios y contextos para crear nuevas habilidades.

Servicios Optimizados para Tareas EspecÃficas

Accede a servicios de alto rendimiento para tareas como reconocimiento de voz, reconocimiento de intención, conversión de texto a voz, estimación de pose, detección de mirada y detección de puntos de referencia faciales a través de una API simple.
Los procesos tuberÃas de cada habilidad se pueden fusionar para desarrollar nuevas habilidades. Cada proceso se ajusta al rendimiento para ofrecer el mayor rendimiento posible y se puede personalizar para tu caso de uso especÃfico.
Desarrollar e Implementar Servicios Fácilmente
Automatiza los pasos que van desde modelos previamente entrenados hasta servicios optimizados implementados en el cloud, el data center y el edge. En segundo plano, Riva aplica potentes optimizaciones de NVIDIA? TensorRT? a los modelos, configura el Servidor de Inferencia NVIDIA Triton?, y expone los modelos como un servicio a través de una API estándar.
Para implementarlo, puedes usar un solo comando para descargar, configurar y ejecutar la aplicación Riva completa o servicios individuales a través de plantillas de Helm en clústeres de Kubernetes. Las plantillas de Helm se pueden personalizar para tu caso de uso y configuración especÃficos.

Adoptadores LÃderes en Todos los Sectores EspecÃficos

Recursos
Empiece a Utilizar NVIDIA
Riva
Comprenda las caracterÃsticas clave de Riva que lo ayudan a crear servicios de inteligencia artificial conversacional multimodal.
Modelos de Ajuste Fino con el Kit de Herramientas de Transfer Learning
Aprenda a ajustar modelos de vanguardia en sus datos para comprender la jerga especÃfica del dominio.
Comprender las CaracterÃsticas de
Riva
Descubra la tecnologÃa subyacente que puede crear asistentes virtuales interactivos y automatizar los centros de llamadas.
Cree Aplicaciones de Inteligencia Artificial Conversacional
Desarrolle su primera aplicación de IA conversacional que minimice la latencia y maximice el rendimiento en las GPU.
RegÃstrese para recibir noticias y actualizaciones de NVIDIA Riva Beta.