GANcraft ：將玩家變成 3D 藝術家

NVIDIA 和康奈爾大學的科學家們引入了一種混合的無監督神經渲染管道，以有效地表示體素世界中的大型復雜場景。從本質上講， 3D 藝術家只需要構建最小值，剩下的部分將由算法來構建照片級真實感世界。研究人員將這種混合神經渲染管道應用于 Minecraft 區塊世界，以生成更逼真的 Minecraft 場景。

NVIDIA 和更廣泛的研究團體（ pix2pix 、 pix2pixHD 、 MUNIT 、 SPADE ）以前的工作已經解決了圖像到圖像轉換（ im2im ）的問題——將圖像從一個域轉換到另一個域。乍一看，這些方法似乎為將一個世界轉換為另一個世界的任務提供了一個簡單的解決方案—一次翻譯一幅圖像。但是， im2im 方法不保持視點一致性，因為它們不了解 3D 幾何體，并且每個 2D 幀都是獨立生成的。從下面的圖像中可以看出，這些方法的結果會產生抖動和突然的顏色和紋理變化。

MUNIT SPADE wc-vid2vid NSVF-W GANCraft

A side by side comparison of past voxel neural rendering pipelines: MUNIT, SPADE, wc-vid2vid, NSVF-W, and GANcraft. You can see the renderings don't hold up as consistently as the GANcraft methodology; blending and distortion occur.

輸入 GANcraft ，這是一種直接在 3D 輸入世界上操作的新方法。

研究人員在 study 中解釋說：“由于用戶創建的塊世界根本不存在地面真實照片級真實感渲染，我們必須通過間接監督來訓練模型。”。

該方法的工作原理是在輸入塊世界中隨機采樣攝影機視圖，然后想象該視圖的真實照片版本是什么樣子。這是在 SPADE 的幫助下完成的，這是 NVIDIA 先前在圖像到圖像轉換方面的工作，也是流行的 GauGAN 演示中的關鍵組件。 GANcraft 通過使用樣式調節網絡克服了這些生成的“偽真實”的視圖不一致性，該網絡可以消除世界結構與渲染樣式之間的歧義。這使 GANcraft 能夠生成與視圖一致的輸出視頻，并且具有不同的風格，如圖所示！