ابزار جدید انویدیا: تبدیل صحنههای ساده سهبعدی به تصاویر پرجزئیات با کمک هوش مصنوعی
تولید تصویر با هوش مصنوعی هنوز هم نتایجش گاهی خوب و گاهی ناامیدکننده است. حتی وقتی که به مدلها رفرنسهای سبکی و ساختاری میدهیم، باز هم باید با دستورات متنی کلی حدس بزنیم و چندین بار امتحان کنیم تا به ترکیب مورد نظر برسیم. غول کارت گرافیک، انویدیا، فکر میکند راهحلی برای این مشکل دارد — و این راهحل از بلندر، یکی از بهترین نرمافزارهای مدلسازی سهبعدی، استفاده میکند.
نقشه راه جدید انویدیا با نام کامل AI Blueprint for 3D-guided Generative AI (یا بهطور خلاصه همان «نقشه راه هوش مصنوعی») به کاربران اجازه میدهد اول صحنه را به شکل سهبعدی بسازند، سپس آن را به Flux.1، ابزار تولید تصویر آزمایشگاه Black Forest Labs، منتقل کنند تا تصویر دوبعدی نهایی ساخته شود.
ایده اصلی ساده است: شما با استفاده از بلندر یک چیدمان اولیه از تصویر میسازید؛ مثلاً ساختمانها، گیاهان، وسایل نقلیه و هر شیء دیگری را در جای دلخواه قرار میدهید. از آنجا که بلندر است، میتوانید زاویه دوربین و سایر جزئیات را هم تنظیم کنید. سپس این صحنه سهبعدی به عنوان مرجع به مدل هوش مصنوعی داده میشود تا تصویر دوبعدی خروجی بر اساس همان ترکیب ساخته شود.
این فرآیند کنترل بسیار بیشتری نسبت به روش معمول (یعنی فقط دستورهای متنی) فراهم میکند، چون شما میتوانید چیدمان صحنه را به شکل بصری در بلندر تغییر دهید و نیاز به آزمون و خطای مکرر با دستورات متنی کمتر میشود. جالب اینکه نیازی نیست صحنه سهبعدی شما خیلی دقیق و پرجزئیات باشد؛ کافی است ترکیببندی کلی را مشخص کند.
انویدیا میگوید این نقشه راه، یک جریان کاری آماده استفاده است که کنترل شهودی روی ساختار تصویر، ترکیببندی و پرسپکتیو را مستقیماً از بلندر ممکن میکند.
پکیج ارائه شده توسط انویدیا شامل:
-
دستورالعملهای گامبهگام
-
فایلهای نمونه
-
محیط از پیش پیکربندی شده (با کد منبع قابل سفارشیسازی)
-
دمویی که نشان میدهد چطور میتوان آن را با جریانهای کاری ComfyUI ادغام کرد
عملکرد این سیستم هم برای کامپیوترهای RTX AI بهینهسازی شده و با استفاده از سرویسهای Nvidia NIM و شتابدهندههای TensorRT و FP4 سرعت گرفته است.
البته انویدیا تاکید کرده که فعلاً این ابزار فقط برای استفادههای غیرتجاری مناسب است.
این نقشه راه هماکنون برای دانلود در وبسایت انویدیا در دسترس است، ولی فقط روی سیستمهایی با کارت گرافیک Nvidia RTX 4080 یا بالاتر اجرا میشود.
