• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    內容創建/渲染

    了解 Stable Diffusion 模型:面向 AEC 專業人員的基本指南

    生成式 AI、算法處理各種類型的輸入—例如文本、圖像、音頻、視頻和代碼—并生成新內容的能力正在以前所未有的速度發展。雖然這項技術在多個行業都取得了重大進展,但建筑、工程和施工 (AEC) 行業將從中受益匪淺。

    歷史上,AEC 公司一直在與支離破碎的數據系統作斗爭。這導致各個部門或項目階段的重要信息被隔離,從而導致效率低下、解釋錯誤和增加項目成本。隨著 生成式 AI 的出現,AEC 行業正處于轉型的邊緣。

    這項前沿技術通過集成數據、自動執行設計任務和增強協作,有可能徹底改變 AEC 行業,從而打造更高效、更創新和更可持續的項目。

    擴散模型:AEC 中生成式 AI 的關鍵組件

    自推出生成式 AI 以來,GPT-4 等大型語言模型 (LLM) 一直處于前沿,以其在自然語言處理、機器翻譯和內容創建方面的通用性而聞名。除此之外,OpenAI 的 DALL-EGoogle 的 ImagenMidjourneyStability AI 的 Stable Diffusion 等圖像生成器正在改變建筑師、工程師和施工專業人員可視化和設計項目的方式,從而實現快速原型設計、增強創造力和更高效的工作流程。

    A futuristic 2 story building nestled in the wilderness.
    圖 1. 擴散模型將噪音轉化為未來建筑圖像

    作為核心,擴散模型具有獨特的能力。它們可以通過逐步添加和消除數據集中的噪聲,從提示生成高質量數據。

    訓練擴散模型的方法是通過多次迭代向數百萬張圖像添加噪點,并在模型在反向過程中重新創建圖像時獎勵模型。訓練完成后,模型就可以進行推理,從而使用戶能夠生成真實的數據,例如圖像、文本、視頻、音頻或 3D 模型。

    為什么是噪聲:它有助于擴散模型模仿隨機變化,理解數據,防止過擬合,并確保平滑轉換。想象一下,你有建筑設計的草圖。你開始在其中添加隨機噪聲,使其看起來越來越像一個凌亂的涂鴉。這是向前的過程。反向過程就像逐步清理那個凌亂的涂鴉,直到你返回到詳細而清晰的建筑渲染。

    該模型會學習如何很好地完成這一清理過程,以便從隨機噪聲開始,最終生成全新、逼真的建筑設計。借助這種創新方法,擴散模型可以生成非常準確和詳細的輸出,使其成為一種強大的工具。

    A sequence of images showing a futuristic home coming into focus.
    圖 2. 一系列圖像,展示了擴散模型如何被訓練以創建新設計

    Diffusion 模型因學習、解釋和生成視覺效果的方式而難以控制。然而,ControlNets 是一組針對特定任務進行訓練的神經網絡,可以增強基礎模型的功能。建筑師可以通過提供參考,對生成過程實施精確的結構和視覺控制。

    Images representing how ControlNets provide structural and visual control over the image generation process
    圖 3. ControlNet 將架構草圖轉換為詳細渲染

    例如,Sketch ControlNet 可以將建筑設計圖紙轉換為完全實現的渲染。

    多個 ControlNet 可以組合在一起以實現額外的控制。例如,Sketch ControlNet 可以與適配器配對,該適配器可以整合參考圖像,以應用特定的顏色和風格到設計中。

    Images representing how multiple ControlNets can be combined together for additional control.
    圖 4. 顯示多個 ControlNets 組合的圖像序列,可實現精確的圖像生成

    ControlNet 非常有效,因為它們可以處理各種類型的信息,為建筑師和設計師提供新的方式來管理設計和與客戶交流想法。

    利用 NVIDIA 加速計算能力,進一步提高了擴散模型的性能。NVIDIA 優化的模型(例如 SDXL Turbo 和 LCM-LoRA),可提供先進的性能和實時圖像生成功能,這些模型顯著提高了推理速度并降低了延遲,每秒可生成多達四張圖像,從而大幅縮短生成高分辨率圖像所需的時間。

    Diffusion 模型為 AEC 領域提供了多種具體優勢,增強了設計、可視化和項目管理的各個方面。

    高質量的可視化效果

    Diffusion 模型可以通過簡單的草圖、文本描述或組合生成逼真的圖像和視頻。這項功能對于創建詳細的建筑渲染和可視化非常重要,可以幫助決策者理解和可視化擬議項目。

    日光和能效

    漫反射模型可以生成日光貼圖,并分析自然光對建筑設計的影響。這有助于優化窗口位置和其他設計元素,以增強室內日光和能效,確保建筑物的舒適性和可持續性。

    快速原型設計

    通過自動生成設計方案和可視化(包括材料或對象定位),擴散模型可以顯著加快設計流程,建筑師和工程師可以更快地探索更多設計方案,leading to 更創新和優化的解決方案。

    成本節約和流程優化

    Diffusion 模型支持自定義 BIM (Building Information Modeling) 策略,以滿足特定區域和項目的需求。通過確保資源直接用于需求最大的區域,資源分配得到改善。這使得策略能夠根據不同區域和項目的獨特需求進行定制,從而降低項目成本并提高整體效率。

    使用、自定義或構建您的擴散模型

    組織可以通過多種方式利用擴散模型。它們可以按原樣使用預訓練模型,根據特定需求對其進行定制,或者從頭開始構建新模型,并根據用戶的獨特需求對其進行定制,從而充分發揮其潛力。

    預訓練模型可立即部署,從而縮短上市時間并最小化初始投資。自定義預訓練模型可以集成特定領域的數據,從而提高特定應用程序的準確性和相關性。從零開始開發模型雖然需要大量資源,但能夠創建高度專業的解決方案,從而應對獨特的挑戰并提供競爭優勢。

    考慮 AEC 行業中的擴散模型,就像建造房屋一樣。使用預訓練模型與使用標準預制房屋類似,它們隨時可以使用,節省時間和初始成本。自定義預訓練模型就像修改標準現成房屋計劃以滿足特定要求,確保設計滿足特定需求和偏好。從頭開始構建模型與從頭開始創建全新藍圖類似,這種方法具有最大的靈活性和定制性,但需要大量的專業知識、時間和資源。

    每種方法都有其優缺點,使組織能夠根據其項目目標和可用資源選擇最適合的方法。

    用于快速部署的預訓練模型

    對于許多組織而言,從擴散模型中受益的最快方法是使用預訓練模型。這些模型通過NVIDIA API 目錄提供,針對高性能進行了優化,并且可以直接部署到應用程序中。

    NVIDIA NIM 為組織提供了一種精簡高效的方法來部署擴散模型,從而能夠根據文本提示生成高分辨率、逼真的圖像。借助預構建的容器,組織可以在 NVIDIA 加速基礎設施 (可從 NVIDIA 工作站、數據中心、云服務合作伙伴和私有本地服務器獲取) 上快速設置和運行擴散模型。

    這種方法簡化了部署流程并最大限度地提高性能,使企業能夠專注于構建創新生成式 AI 工作流程,而無需承擔復雜的模型開發和優化工作。

    開發者可以免費體驗和實驗 NVIDIA 托管的 NIM

    企業可以通過 NIM 通過NVIDIA AI Enterprise 軟件平臺在生產環境中部署 AI 應用。

    自定義擴散模型

    自定義擴散模型可以提高 AEC 組織的擴散模型的相關性、準確性和性能。它還使組織能夠包含自己的知識和行業特定術語,并應對特定挑戰。

    微調包括采用預訓練模型,并使用較小的特定領域數據集調整其參數,以更好地滿足組織的特定需求和細微差別。這種定制方法可提高生成內容的質量和效用,并提供可擴展性和靈活性組織可以根據需求的變化調整模型。

    對于希望通過用戶友好型路徑開始自定義擴散模型的公司,NVIDIA AI Workbench 提供了一個精簡的環境,讓數據科學家和開發者能夠快速啟動并運行生成式 AI。借助 AI Workbench,用戶可以開始使用適應不同數據和用例的預配置項目,它是快速迭代開發和本地測試的理想選擇。

    微調擴散模型等示例項目可以進行修改,以支持生成建筑渲染等操作。此外,這種靈活性還擴展到支持的基礎設施。用戶可以在 NVIDIA RTX 助力的 AI 工作站上本地啟動,然后擴展到幾乎任何位置—數據中心或云—僅需幾次點擊。有關如何自定義擴散模型的更多詳細信息,請探索 GitHub 項目

    另一種用于微調擴散模型的輕量級訓練技術是 Low-Rank Adaptation 或 LoRA。LoRA 模型由于規模較小非常適合建筑公司,它們可以在本地工作站上進行管理和訓練,而無需大量的云資源。

    了解如何使用 NVIDIA NIM 無縫部署和擴展多個 LoRA 適配器。

    對于高級自定義和高性能訓練,NVIDIA NeMo 提供了一個全面、可擴展、云原生的平臺。NeMo 提供了多種 自定義技術,并針對擴散模型的大規模推理進行了優化,具有多 GPU 和多節點配置。

    集成到 NeMo 框架中的 DRaFT 算法,增強了對擴散模型的微調,并確保模型產生符合特定項目要求的多樣化高質量輸出。有關更多技術細節和訪問 DRaFT 算法,請訪問 GitHub 上的 NeMo-Aligner 庫

    NVIDIA Launchpad 提供了一個免費的動手實驗室環境,AEC 專業人員可以在其中學習使用自定義圖像微調擴散模型,并針對特定任務(例如生成高質量建筑渲染或施工項目可視化)優化這些模型。

    構建符合您風格的擴散模型

    現在,我們已經介紹了預訓練和自定義模型,讓我們從頭開始構建擴散模型。投資自定義擴散模型使 AEC 組織能夠充分利用 AI 的全部潛力,從而獲得更高效、更準確和更創新的項目成果。

    例如,建筑事務所可能會構建自己的擴散模型,以生成符合其特定建筑設計風格和客戶偏好的設計概念,而建筑公司可能會開發模型來優化資源分配和項目調度。

    這種方法的一個例子是總部位于倫敦的設計公司 Heatherwick Studio 的工作,他們一直在設計過程中使用 AI。該工作室以其創新項目而聞名,包括位于倫敦和加利福尼亞州的 Google 總部、位于開普敦的非洲首個當代非洲藝術博物館以及東京的一個新建地區。Heatherwick Studio 一直在開發使用其數據來簡化設計流程、渲染和數據訪問的工具。

    “在工作室,我們不僅相信 AI 在改善行業方面的變革力量,而且還在日常工作中積極開發和部署內部自定義擴散模型,”Heatherwick studio 的幾何與計算設計主管 Pablo Zamorano 說。

    我們開發了一款基于 Web 的工具,可以實現快速設計挑戰、快速渲染和圖像編輯,以及一款可在我們的 BIM 工具中進行定制知識搜索的工具,這些工具為我們的設計師和可視化者的工作提供支持,并且現已成熟。

    Image illustration of converting an architectural sketch into a detailed render.
    圖 5.圖片由 Heatherwick Studio 提供,顯示了基于其自定義模型生成設計選項的 2D 圖表

    使用 NVIDIA 創建自定義擴散模型

    NeMo 提供了一個功能強大的框架,為在本地、所有領先的云服務提供商或 NVIDIA DGX 云中構建和訓練自定義擴散模型提供組件。它包括從 prompt 學習到參數高效微調 (PEFT) 的一套自定義技術,非常適合需要生成高質量建筑渲染和高效優化施工可視化的 AEC 客戶。

    或者,NVIDIA Picasso 是一家 AI Foundry,資產市場公司利用其構建和部署先進的生成式 AI 模型,以提供具有商業安全性的視覺內容的 API。

    基于 Picasso 構建的生成式 AI 服務,由 Getty Images 提供用于圖像生成和 Shutterstock 提供用于 3D 生成,創建商業上安全的視覺媒體從文本或圖像。AEC 組織可以微調他們選擇的 Picasso 支持的模型,以創建自定義擴散模型,從而從不同風格的文本提示或草圖中生成圖像。Picasso 支持從數據準備和模型訓練到模型微調和部署的端到端 AI 模型開發,使其成為開發自定義生成式 AI 服務的理想解決方案。

    通過擴散模型實現負責任的創新

    使用 AI 模型涉及多個關鍵步驟,包括數據收集、預處理、算法選擇、訓練和評估。每個步驟都需要仔細考慮,以確保模型表現良好并滿足項目的特定需求。

    然而,在整個過程中集成負責任的 AI 實踐同樣重要。生成式 AI 模型盡管功能出色,但容易受到偏見、安全漏洞和意外結果的影響。如果沒有適當的保障措施,這些模型可能會產生強化有害的陳規定型觀念、區別對待某些人口結構或包含安全漏洞的輸出。

    此外,保護擴散模型的安全性對于生成式 AI 驅動的應用程序至關重要。NVIDIA 推出了加速機密計算

    開始使用

    生成式 AI(尤其是擴散模型)正在革新 AEC 行業,通過簡單的草圖或文本描述創建逼真的渲染和創新設計。

    首先,AEC 公司應優先考慮數據收集和管理,確定可從自動化中受益的流程,并采用分階段實施的方法。The NVIDIA 培訓計劃 幫助組織培訓員工掌握最新技術,通過提供全面的技術實戰研討會和課程彌合技能差距。

    ?

    +2

    標簽

    人人超碰97caoporen国产