NVIDIA Maxine

SDK acelerado con funciones de inteligencia artificial de Ãºltima generaciÃ³n para crear aplicaciones de creaciÃ³n de contenido y colaboraciÃ³n virtual.

EMPEZAR

?QuÃ© es NVIDIA Maxine?

NVIDIA Maxine es un SDK acelerado por GPU con funciones de inteligencia artificial de Ãºltima generaciÃ³n para que los desarrolladores creen aplicaciones de creaciÃ³n de contenido y colaboraciÃ³n virtual, como videoconferencias y transmisiÃ³n en vivo.

Los SDK de IA de Maxine (efectos de video, efectos de audio y realidad aumentada (AR)) estÃ¡n altamente optimizados e incluyen caracterÃsticas modulares que se pueden encadenar en pipelines de un extremo a otro para brindar el mayor rendimiento posible en las GPU, tanto en PC como en data centers. Maxine tambiÃ©n se puede utilizar con NVIDIA Riva, un SDK para crear aplicaciones conversacionales de inteligencia artificial, para ofrecer capacidades basadas en idiomas de clase mundial, como la transcripciÃ³n y la traducciÃ³n.

Los desarrolladores pueden agregar efectos de IA de Maxine a sus aplicaciones existentes o desarrollar nuevos pipelines desde cero utilizando NVIDIA DeepStream, un SDK para crear anÃ¡lisis de video inteligente, y NVIDIA Video Codec, un SDK para codificaciÃ³n, decodificaciÃ³n y transcodificaciÃ³n aceleradas.

Beneficios

Capacidades de IA de Vanguardia

Modelos previamente entrenados de clase mundial para capacidades de audio, video y realidad aumentada (AR) de alta calidad.

Rendimiento de IA en Tiempo Real

Funciones de IA aceleradas y optimizadas para inferencias en tiempo real en GPU.

SoluciÃ³n de Extremo a Extremo

Pipelines completos de extremo a extremo para decodificaciÃ³n de video, transcodificaciÃ³n, codificaciÃ³n, inteligencia artificial conversacional, visiÃ³n por computadora, streaming de video y anÃ¡lisis.

Touchcast utiliza tecnologÃas de inteligencia artificial y renderizado de Ãºltima generaciÃ³n para ejecutar hermosos eventos en lÃnea con impresionantes lugares virtuales realistas y capacidades de colaboraciÃ³n en tiempo real. Como lÃder en impulsar la prÃ³xima era de la computaciÃ³n, NVIDIA Maxine estÃ¡ preparando el futuro de las comunicaciones por video, un futuro en el que la inteligencia artificial y las redes neuronales mejoran y enriquecen el contenido de formas completamente nuevas. Al trabajar con NVIDIA, Touchcast puede seguir estando a la vanguardia en la creaciÃ³n de las experiencias mÃ¡s increÃbles del mundo para sus clientes.

Edo Segal, Fundador y CEO

SDK de Maxine

SDK de Efectos de Video

El SDK de Efectos de Video de Maxine permite efectos visuales basados en inteligencia artificial que se ejecutan con la entrada estÃ¡ndar de la cÃ¡mara web y se pueden integrar fÃ¡cilmente en las canalizaciones de videoconferencia y creaciÃ³n de contenido. Los modelos de deep learning subyacentes se optimizan con NVIDIA? TensorRT? para inferencias de alto rendimiento, lo que hace posible que los desarrolladores apliquen mÃºltiples efectos en aplicaciones en tiempo real.

Las caracterÃsticas clave incluyen:

SÃºper resoluciÃ³n: genera un video con detalles mejorados utilizando redes neuronales de inteligencia artificial que reducen los artefactos y preservan la textura con un escalado de alta calidad de hasta 4 veces.
Upscaler: ofrece un alto rendimiento y un video escalado de alta calidad hasta 4 veces con un parÃ¡metro de nitidez ajustable.
ReducciÃ³n de artefactos: elimina los artefactos de compresiÃ³n del video codificado mientras conserva los detalles originales.
EliminaciÃ³n de ruido de video: elimina el ruido de la cÃ¡mara con poca luz introducido en el proceso de captura de video mientras conserva los detalles.
Fondo virtual: segmenta a una persona y aplica la eliminaciÃ³n, el reemplazo o el desenfoque del fondo con tecnologÃa de inteligencia artificial.

COMIENCE CON EL SDK DE EFECTOS DE VIDEO ?

SDK de Realidad Aumentada

El SDK de Realidad Aumentada ofrece seguimiento facial en 3D en tiempo real y basado en inteligencia artificial y estimaciÃ³n de la pose corporal basada en una cÃ¡mara web estÃ¡ndar. Los desarrolladores pueden crear efectos AR Ãºnicos, como superponer contenido 3D en una cara, conducir personajes 3D e interacciones virtuales en tiempo real.

Las caracterÃsticas clave incluyen:

Seguimiento facial: detecta rostros humanos en imÃ¡genes y videos y especifica la ubicaciÃ³n y el tama?o del cuadro delimitador.
Seguimiento de puntos de referencia faciales: reconoce los rasgos y contornos faciales utilizando 126 puntos clave y rastrea la postura de la cabeza y la deformaciÃ³n facial debido al movimiento y la expresiÃ³n de la cabeza en tres grados de libertad en tiempo real.
Malla de rostros: representa un rostro humano con una malla 3D con hasta 3000 vÃ©rtices y seis grados de libertad.
EstimaciÃ³n de la postura del cuerpo: predice y rastrea 34 puntos clave del cuerpo humano en 2D y 3D. Se utiliza habitualmente en el reconocimiento de actividades, la transferencia de movimiento y las interacciones virtuales en tiempo real.
Contacto visual (solicite acceso anticipado): simula el contacto visual estimando y alineando la mirada con la cÃ¡mara.
Audio2Face (prÃ³ximamente): anima una cara digital 2D o 3D con alta fidelidad basada solo en una entrada de audio.

COMIENCE CON EL SDK DE REALIDAD AUMENTADA ?

SDK de Efectos de Audio

El SDK de Efectos de Audio ofrece algoritmos de mejora de la calidad de audio basados en inteligencia artificial, que mejoran la calidad de conversaciÃ³n de un extremo a otro para audio de banda estrecha, banda ancha y banda ultraancha.

Los modelos de IA optimizados de alto rendimiento permiten procesar miles de transmisiones de audio en tiempo real por GPU, mejorando la calidad de audio en hasta dos puntos de puntuaciÃ³n de opiniÃ³n media (MOS) en mÃ©tricas de calidad objetivas y subjetivas, como la EvaluaciÃ³n Perceptual de la Calidad del Habla (PESQ) y AnÃ¡lisis Perceptual de la Calidad Auditiva Objetiva (POLQA). En las aplicaciones de escritorio, los modelos optimizados permiten que mÃºltiples aplicaciones, como games, se ejecuten simultÃ¡neamente con un impacto mÃnimo en la calidad de ambas aplicaciones.

Los desarrolladores pueden integrarse en aplicaciones independientes de Windows y Linux para procesar el audio del micrÃ³fono y el altavoz o en servidores de alta densidad para procesar miles de transmisiones de audio por servidor.

Las caracterÃsticas clave incluyen:

EliminaciÃ³n de ruido (NR): elimina varios ruidos de fondo comunes utilizando modelos de inteligencia artificial de Ãºltima generaciÃ³n mientras se conserva la voz natural del hablante.
EliminaciÃ³n de eco de sala (REC): elimina las reverberaciones del audio utilizando modelos de IA de Ãºltima generaciÃ³n, restaurando la claridad de la voz de un hablante.
SÃºper resoluciÃ³n de audio (solicite acceso anticipado): mejora la calidad del audio en tiempo real al aumentar la frecuencia de muestreo del flujo de entrada de audio de 8kHz a 16kHz y de 16kHz a 48kHz.
CancelaciÃ³n de eco acÃºstico (solicitar acceso anticipado): cancela el eco del dispositivo acÃºstico en tiempo real de la transmisiÃ³n de audio de entrada. Con la tecnologÃa basada en IA, se logra una cancelaciÃ³n mÃ¡s efectiva que con el procesamiento tradicional de se?ales digitales.

Con estas funciones, los desarrolladores tambiÃ©n pueden crear multiplos efectos innovadores combinando NR y REC al tiempo que ofrecen un rendimiento optimizado y latencia en tiempo real.

COMIENCE CON EL SDK DE EFECTOS DE AUDIO ?

Proyecto Maxine se Basa en Potentes SDK de NVIDIA

Explore tecnologÃas que se integran con el pipeline modular, personalizable y escalable de Maxine. Por ejemplo, la colaboraciÃ³n con audiencias globales se puede mejorar significativamente cuando se habla en su idioma. Para permitir una mejor comunicaciÃ³n y comprensiÃ³n, el Proyecto Maxine integra la traducciÃ³n en tiempo real y la conversiÃ³n de texto a voz de NVIDIA Riva con animaciÃ³n fotogrÃ¡fica "retrato en vivo" y contacto visual en tiempo real. El Proyecto Maxine es una aplicaciÃ³n de referencia para Omniverse Avatar, una plataforma tecnolÃ³gica para generar avatares de IA interactivos.

AnÃ¡lisis de ImÃ¡genes y Videos

El SDK DeepStream ofrece un pipeline de transmisiÃ³n de un extremo a otro para el procesamiento de mÃºltiples sensores y la comprensiÃ³n de video e imÃ¡genes basados en inteligencia artificial.

MÃ¡S INFORMACIÃ³N

CodificaciÃ³n y DecodificaciÃ³n de Video

El SDK de CodificaciÃ³n de Video es un conjunto completo de API, que incluye herramientas de alto rendimiento, muestras y documentaciÃ³n, para la codificaciÃ³n y decodificaciÃ³n de video acelerada por hardware en Windows y Linux. El AI Face Codec (prÃ³ximamente) permitirÃ¡ un video mÃ¡s fluido y una reducciÃ³n del ancho de banda de hasta 10 veces.

MÃ¡S INFORMACIÃ³N

IA Conversacional

El SDK Riva es un framework de aplicaciÃ³n para servicios de inteligencia artificial conversacional multimodal que ofrece rendimiento en tiempo real en las GPU.

MÃ¡S INFORMACIÃ³N

Recursos

Reinventar las Aplicaciones de Video

Descubra cÃ³mo los desarrolladores de Notch, Headroom, Be.Live y Touchcast utilizan NVIDIA Maxine.

VER AHORA

Nuevas TecnologÃas de IA

Lea acerca de las Ãºltimas herramientas de software para desarrolladores lanzadas en GTC 2021.

LEER NOTICIAS

PresentaciÃ³n de Apertura de GTC 2021

Obtenga informaciÃ³n sobre la Ãºltima actualizaciÃ³n para NVIDIA Maxine del CEO de NVIDIA, Jensen Huang.

VER AHORA

Ãºltimas Noticias de Maxine

Lea cÃ³mo los proveedores lÃderes de colaboraciÃ³n, creaciÃ³n de contenido y transmisiÃ³n estÃ¡n utilizando NVIDIA Maxine.

LEER NOTICIAS

NVIDIA Maxine se puede descargar de forma gratuita para los miembros del Programa para Desarrolladores de NVIDIA.

DESCARGAR AHORA

NVIDIA Maxine

NVIDIA Maxine

?QuÃ© es NVIDIA Maxine?

Beneficios

Capacidades de IA de Vanguardia

Rendimiento de IA en Tiempo Real

SoluciÃ³n de Extremo a Extremo

SDK de Maxine

SDK de Efectos de Video

SDK de Realidad Aumentada

SDK de Efectos de Audio

Proyecto Maxine se Basa en Potentes SDK de NVIDIA

AnÃ¡lisis de ImÃ¡genes y Videos

CodificaciÃ³n y DecodificaciÃ³n de Video

IA Conversacional

Recursos

Reinventar las Aplicaciones de Video

Nuevas TecnologÃ­as de IA

PresentaciÃ³n de Apertura de GTC 2021

Ãºltimas Noticias de Maxine

Nuevas TecnologÃas de IA