هوش مصنوعی میدجرنی Midjourney چیست و چطور با آن کار کنیم؟

با بهره‌وری از هوش مصنوعی، دیگر خلق کردن تصاویر خارق‌العاده و چشم‌گیر منحصر به هنرمندان نیست و همه می‌توانند با نوشتن چند خط پرامپت استاندارد در هوش مصنوعی midjourney تصاویری منحصربه‌فرد خلق کنند.
این ابزار قدرتمند هم برای افراد حرفه‌ای در حوزه هنر و طراحی و هم برای هر کسی که به دنبال بیان بصری ایده‌های خود است، یک انقلاب به شمار می‌رود. از ایده‌های تبلیغاتی و طراحی مفهومی گرفته تا ساخت تصاویر پروفایل و هنرهای شخصی، Midjourney افق‌های جدیدی را پیش روی ما گشوده است. در این مقاله جامع، به بررسی عمیق Midjourney، نحوه کار با آن، دستورات کاربردی و پیشرفته، مقایسه آن با سایر ابزارهای مشابه و نگاهی به آینده این فناوری می‌پردازیم.

هوش مصنوعی میدجرنی (midjourney) چیست؟ 

هوش مصنوعی midjourney یک برنامه هوش مصنوعی مولد است که به طور خاص برای تولید تصاویر از توصیفات متنی (Text-to-Image) طراحی شده است. این ابزار پیشرفته، بر اساس مدل‌های یادگیری عمیق پیچیده (مانند شبکه‌های عصبی و ترانسفورمرها) کار می‌کند که توانایی شگفت‌انگیزی در درک و ترجمه کلمات به مفاهیم بصری را دارند. به زبان ساده‌تر، شما ایده‌های خود را به زبان طبیعی و نوشتاری بیان می‌کنید و Midjourney آن را به یک اثر هنری بصری تبدیل می‌کند. این فناوری توسط آزمایشگاه تحقیقاتی مستقل Midjourney Inc. توسعه یافته و از طریق یک ربات دیسکورد (Discord bot) در دسترس قرار می‌گیرد. این روش دسترسی، به کاربران امکان می‌دهد به راحتی و از طریق یک پلتفرم ارتباطی محبوب، با این هوش مصنوعی تعامل داشته باشند.

آموزش ساخت تصویر با هوش مصنوعی midjourney

برای شروع کار با Midjourney و خلق اولین تصاویر خود، باید مراحل ساده‌ای را دنبال کنید. همانطور که پیشتر اشاره شد، Midjourney عمدتاً از طریق دیسکورد کار می‌کند و شما با استفاده از دستورات متنی با ربات Midjourney تعامل خواهید داشت.

مراحل گام به گام:

عضویت در دیسکورد: اگر هنوز حساب کاربری در دیسکورد ندارید، ابتدا یک حساب رایگان و سریع در وب‌سایت Discord ایجاد کنید. دیسکورد یک پلتفرم چت و ارتباطی محبوب است که برای گروه‌های مختلف، از جمله جامعه Midjourney، استفاده می‌شود.
پیوستن به سرور Midjourney: پس از ایجاد حساب دیسکورد، به وب‌سایت رسمی Midjourney (midjourney.com) مراجعه کنید. در این صفحه، دکمه‌ای با عنوان “Join the Beta” یا “Sign In” وجود دارد. با کلیک بر روی آن، شما به سرور دیسکورد رسمی Midjourney هدایت می‌شوید.
پذیرفتن قوانین و مقررات: پس از ورود به سرور، معمولاً لازم است قوانین و شرایط استفاده از Midjourney را مطالعه و بپذیرید. این مرحله برای اطمینان از محیطی امن و مناسب برای همه کاربران ضروری است.
ورود به کانال‌های تولید تصویر: در نوار کناری سمت چپ دیسکورد، لیستی از کانال‌ها را مشاهده خواهید کرد. به یکی از کانال‌هایی که برای تولید تصویر در نظر گرفته شده‌اند، مانند کانال‌های “newbies” (تازه‌کاران) یا کانال‌های مشابه با نام‌های عددی (مثلاً newbies-1, newbies-2 و غیره) بروید. این کانال‌ها محیطی برای شروع کار و آزمایش دستورات هستند.
استفاده از دستور اصلی /imagine: برای آغاز فرآیند تولید تصویر، در کادر پیام‌رسان دیسکورد، دستور /imagine را تایپ کنید. پس از تایپ این دستور و فشار دادن کلید Space یا Enter، یک فیلد متنی به نام prompt ظاهر می‌شود.
وارد کردن Prompt (توصیف متنی) ایده‌آل شما: در فیلد prompt، توصیف دقیق و خلاقانه خود را از تصویری که می‌خواهید ایجاد کنید. این توصیف، کلید اصلی برای رسیدن به نتیجه دلخواه شماست. هرچه توصیف شما دقیق‌تر، جزئی‌تر و غنی‌تر باشد، Midjourney می‌تواند تصویر مطلوب‌تری را برای شما خلق کند.

مثال: فرض کنید می‌خواهید تصویری از “یک قصر باستانی شناور در آسمان، احاطه شده با ابرهای صورتی و بنفش در هنگام طلوع آفتاب، با سبک فانتزی حماسی و جزئیات فراوان” بسازید.

تایید و تولید تصویر: پس از وارد کردن توصیف، کلید Enter را فشار دهید. ربات Midjourney شروع به پردازش درخواست شما می‌کند. این فرآیند بسته به پیچیدگی توصیف و ترافیک سرور، ممکن است چند ثانیه تا یک دقیقه طول بکشد. در نهایت، Midjourney چهار تصویر اولیه را بر اساس توصیف شما تولید می‌کند.
انتخاب و ویرایش تصاویر (Upscale و Variations): زیر چهار تصویر تولید شده، دکمه‌هایی با برچسب‌های U1, U2, U3, U4 و V1, V2, V3, V4 مشاهده خواهید کرد:

U (Upscale – افزایش وضوح): با کلیک روی هر دکمه U (به عنوان مثال U1 برای تصویر بالا سمت چپ)، Midjourney نسخه با وضوح بالاتر و جزئیات بیشتر (Upscale) از آن تصویر خاص را تولید می‌کند. این نسخه برای استفاده نهایی مناسب‌تر است.
V (Variations – ایجاد تنوع): با کلیک روی هر دکمه V (به عنوان مثال V1 برای تصویر بالا سمت چپ)، Midjourney چهار نسخه جدید و متفاوت از آن تصویر را بر اساس سبک و محتوای آن تولید می‌کند. این گزینه برای کاوش ایده‌های جدید یا بهبود نتایج اولیه بسیار مفید است.
Refresh (فلش دایره‌ای): این دکمه به شما امکان می‌دهد تا چهار تصویر جدید را بر اساس همان توصیف اولیه تولید کنید، که می‌تواند منجر به نتایج کاملاً جدیدی شود.

 

دستورات کاربردی هوش مصنوعی میدجرنی

Midjourney مجموعه‌ای غنی از دستورات و پارامترها را ارائه می‌دهد که به شما امکان می‌دهد کنترل بی‌نظیری بر روی خروجی نهایی داشته باشید. این دستورات پس از توصیف اصلی و با اضافه می‌شوند.

دستورات پرکاربرد و ضروری:

–ar <عرض>:<ارتفاع> (نسبت تصویر): این دستور یکی از پرکاربردترین پارامترهاست و نسبت عرض به ارتفاع تصویر را تعیین می‌کند.

مثال: برای یک تصویر عریض که مثلاً برای پس‌زمینه دسکتاپ مناسب باشد، مانند “یک منظره کوهستانی باشکوه با رودخانه‌ای خروشان”، از –ar 16:9 استفاده کنید. (مثال کامل: /imagine prompt یک منظره کوهستانی باشکوه با رودخانه ای خروشان –ar 16:9)
مثال: برای یک تصویر عمودی که برای داستان‌های اینستاگرام یا پس‌زمینه گوشی مناسب باشد، مانند “پرتره‌ای از یک زن با کلاه بزرگ”، از –ar 2:3 یا –ar 9:16 استفاده کنید.

–v <نسخه> (نسخه مدل): Midjourney به طور مداوم نسخه‌های جدیدی از مدل هوش مصنوعی خود را منتشر می‌کند. هر نسخه دارای ویژگی‌ها، سبک‌ها و توانایی‌های خاص خود در درک و تولید تصویر است.

مثال: برای استفاده از جدیدترین و پیشرفته‌ترین نسخه برای “یک جنگل پریان عجیب و غریب با قارچ‌های درخشان”، از –v 6.0 استفاده کنید. (مثال کامل: /imagine prompt یک جنگل پریان عجیب و غریب با قارچ های درخشان –v 6.0)
توجه: نسخه 6.0 (V6) در زمان حال، جدیدترین و پیشرفته‌ترین نسخه است و قابلیت درک بهتر توصیفات و جزئیات بیشتر را دارد.

–style <raw> (سبک خام): این پارامتر که از نسخه V6 به بعد معرفی شده، به شما اجازه می‌دهد خروجی خام‌تر و کمتر “استایل‌دار” را دریافت کنید. این حالت کنترل بیشتری بر روی جزئیات و واقع‌گرایی می‌دهد و از اعمال سبک پیش‌فرض Midjourney می‌کاهد.

مثال: برای “یک فانوس دریایی قدیمی در ساحل طوفانی” با تمرکز بر جزئیات واقع‌گرایانه و بدون سبک‌پردازی زیاد، از –style raw استفاده کنید.

–seed <عدد> (سید یا بذر): با استفاده از یک عدد سید خاص (مثلاً 12345)، می‌توانید تولید تصاویری با نتایج بسیار مشابه در دفعات بعدی را تضمین کنید. این برای آزمایش و بهبود توصیف، یا تولید تغییرات جزئی بر اساس یک تصویر اولیه بسیار مفید است.

مثال: اگر تصویری از “یک درخت گیلاس شکوفا” با سید 12345 تولید کرده‌اید و می‌خواهید تغییرات کوچکی در آن ایجاد کنید، می‌توانید همان سید را دوباره استفاده کنید.

–no <کلمه یا عبارت> (حذف عنصر): این دستور به شما اجازه می‌دهد تا عناصر خاصی را که نمی‌خواهید در تصویر نهایی ظاهر شوند، حذف کنید.

مثال: برای “یک باغ زیبا بدون گل‌های قرمز”، از –no گل‌های قرمز استفاده کنید.

–quality <0.25 | 0.5 | 1 | 2> (کیفیت تصویر): این پارامتر میزان زمان صرف شده برای پردازش و تولید تصویر و در نتیجه کیفیت آن را کنترل می‌کند. کیفیت‌های بالاتر (مانند 1 یا 2) زمان بیشتری می‌برند و اعتبار بیشتری مصرف می‌کنند، اما جزئیات و وضوح بیشتری دارند.

مثال: برای “یک پرتره با جزئیات بسیار بالا از یک پیرمرد با چروک‌های صورت مشخص”، از –quality 2 استفاده کنید.

–stylize <عدد> (میزان سبک‌سازی): این پارامتر میزان “هنری” بودن و “زیبایی” تصویر را کنترل می‌کند. مقادیر بالاتر منجر به تصاویر با جزئیات بیشتر، هنری‌تر و اغلب با رنگ‌های زنده‌تر می‌شوند، اما ممکن است از توصیف اصلی کمی فاصله بگیرند.

مثال: برای “یک منظره آرام” با سبک‌سازی هنری‌تر، از –stylize 1000 استفاده کنید (مقدار پیش‌فرض 100 است).

–chaos <عدد> (میزان آشفتگی/تنوع): این پارامتر میزان تنوع در نتایج اولیه را کنترل می‌کند. مقادیر بالاتر منجر به نتایج متنوع‌تر و غیرقابل پیش‌بینی‌تر در چهار تصویر اولیه می‌شوند، که برای کشف ایده‌های جدید مفید است.

مثال: برای “یک وسیله نقلیه آینده‌نگر” که می‌خواهید تنوع زیادی در طرح‌های اولیه آن ببینید، از –chaos 50 استفاده کنید.

/blend (ترکیب تصاویر): این دستور به شما امکان می‌دهد چندین تصویر (معمولاً 2 تا 5 تصویر) را با هم ترکیب کنید تا یک تصویر جدید با الهام از هر دو ایجاد شود.

نحوه استفاده: کافیست /blend را تایپ کرده و سپس تصاویری را که می‌خواهید ترکیب کنید، آپلود نمایید.

/settings: این دستور یک منوی تنظیمات شخصی را نمایش می‌دهد که می‌توانید تنظیمات پیش‌فرض خود را برای کیفیت، سبک‌سازی و نسخه مدل تغییر دهید تا مجبور نباشید هر بار این پارامترها را وارد کنید.

مقایسه ویژگی های هوش مصنوعی midjourney و DALL-E

Midjourney و DALL-E (که توسط شرکت OpenAI توسعه یافته است) دو رقیب اصلی و قدرتمند در زمینه تولید تصویر از متن هستند. هر دو ابزار قابلیت‌های چشمگیری دارند، اما تفاوت‌های کلیدی در رویکرد، قابلیت‌ها و نوع خروجی نهایی آنها وجود دارد که درک آنها برای انتخاب ابزار مناسب ضروری است.

سبک هنری و زیبایی‌شناسی:

Midjourney به طور خاص در تولید تصاویری با سبک هنری قوی و زیبا شناسی خاص سرآمد است. خروجی‌های آن اغلب فانتزی، سورئال، حماسی، و با اتمسفر و حس و حال عمیق هستند. تصاویر Midjourney اغلب بسیار واقع‌گرا، سینمایی و با نورپردازی و رنگ‌بندی چشم‌نواز هستند. اگر به دنبال خلق آثار هنری خیره‌کننده با سبک منحصر به فرد هستید، Midjourney انتخاب اول شما خواهد بود.
DALL-E در مقابل، خروجی‌های متنوع‌تر و واقع‌گرایانه‌تر را ارائه می‌دهد، با تاکید بیشتر بر دقت در بازتولید عناصر و مفاهیم. این ابزار معمولاً برای تولید تصاویر محصول، گرافیک‌های ساده‌تر، یا تصاویری که نیاز به دقت بالا در جزئیات و منطبق با توصیف دقیق دارند، کاربرد بیشتری پیدا می‌کند. DALL-E تلاش می‌کند تا هر چیزی را که شما توصیف می‌کنید، دقیقاً همانطور که هست، به تصویر بکشد.

دقت در درک توصیف و کنترل‌پذیری:

Midjourney برای دستیابی به نتایج مطلوب، نیاز به توصیفات خلاقانه و تا حدودی انتزاعی دارد. درک آن از مفاهیم و حالات انتزاعی قوی است و از پارامترهای متعدد برای کنترل نسبت تصویر، سبک، کیفیت و میزان آشفتگی پشتیبانی می‌کند که به کاربران اجازه می‌دهد تا حد زیادی بر خروجی نهایی تأثیر بگذارند.
DALL-E درک بسیار قوی از دستورات دقیق و پیچیده دارد و توانایی تولید تصاویر با جزئیات دقیق بر اساس توضیحات را به خوبی انجام می‌دهد. همچنین، DALL-E کنترل‌های دقیقی برای قابلیت‌هایی مانند Inpainting” (تغییر یا جایگزینی بخشی از تصویر) و Outpainting” (گسترش تصویر موجود فراتر از مرزهای اولیه آن) ارائه می‌دهد که برای ویرایش تصاویر موجود بسیار کارآمد است.

رابط کاربری و دسترسی:

Midjourney عمدتاً از طریق دیسکورد و با استفاده از دستورات متنی کار می‌کند. این روش ممکن است برای کاربران جدید کمی ناآشنا باشد و نیاز به عادت کردن دارد.
DALL-E معمولاً از طریق یک رابط کاربری وب ساده و بصری در دسترس است که استفاده از آن را برای کاربران عمومی و بدون دانش قبلی از دستورات، آسان‌تر می‌کند.

سرعت تولید و مدل‌های کسب و کار:

Midjourney معمولاً در تولید چهار تصویر اولیه سریع عمل می‌کند، اما عملیات Upscale (افزایش وضوح) ممکن است کمی زمان‌بر باشد. این سرویس دارای پلن‌های اشتراکی ماهانه یا سالانه با سطوح مختلف دسترسی و سرعت است.
DALL-E معمولاً سرعت بالایی در تولید تصاویر دارد و از سیستم اعتباری (Credit-based) استفاده می‌کند که با خرید اعتبار می‌توانید تصاویر تولید کنید.

جامعه کاربری و به‌روزرسانی‌ها:

Midjourney دارای یک جامعه بسیار فعال و پرشور در دیسکورد است که کاربران به طور مداوم آثار و نکات خود را به اشتراک می‌گذارند. به‌روزرسانی‌های مکرر با نسخه‌های جدید مدل (مانند V6) نیز از ویژگی‌های آن است.
DALL-E نیز جامعه کاربری فعالی دارد، اما کمتر بر جنبه‌های هنری متمرکز است و بیشتر برای کاربردهای تجاری و گرافیکی استفاده می‌شود. این ابزار نیز به‌روزرسانی‌های منظم و معرفی قابلیت‌های جدید را ارائه می‌دهد.

اگر هدف اصلی شما خلق آثار هنری بصری خیره‌کننده، فانتزی، سورئال، یا تصاویر سینمایی با سبک و اتمسفر خاص است و از آزمایش با توصیفات و پارامترها لذت می‌برید، Midjourney بدون شک انتخاب بهتری است. اما اگر به دقت بالا در بازتولید اشیاء، تولید تصاویر محصول، یا قابلیت‌های پیشرفته ویرایش و گسترش تصاویر موجود نیاز دارید، DALL-E ممکن است مناسب‌تر باشد. بسیاری از کاربران پیشرفته و حرفه‌ای در حوزه طراحی و هنر دیجیتال، از هر دو ابزار برای اهداف مختلف استفاده می‌کنند، زیرا هر کدام نقاط قوت منحصر به فرد خود را دارند و می‌توانند مکمل یکدیگر باشند.

دانلود هوش مصنوعی midjourney

هوش مصنوعی midjourney به معنای واقعی کلمه یک “نرم‌افزار قابل دانلود” نیست. همانطور که قبلاً اشاره شد، Midjourney یک سرویس مبتنی بر ابر (Cloud-based Service) است. این بدان معناست که هسته اصلی هوش مصنوعی و پردازش‌های سنگین آن بر روی سرورهای قدرتمند Midjourney در اینترنت انجام می‌شود و نتایج به کاربران ارسال می‌گردد. شما به جای “دانلود” و نصب یک نرم‌افزار، به این سرویس دسترسی پیدا می‌کنید.

نحوه دسترسی به Midjourney:

از طریق دیسکورد (رایج‌ترین و اصلی‌ترین راه):

عضویت در سرور دیسکورد Midjourney: این ابتدایی‌ترین و رایج‌ترین راه دسترسی است. شما با پیوستن به سرور رسمی Midjourney در دیسکورد، می‌توانید از طریق ربات Midjourney در کانال‌های مشخص شده، با آن تعامل داشته باشید و دستورات خود را برای تولید تصویر ارسال کنید. این فرآیند نیاز به هیچ “دانلود” نرم‌افزاری جز خود برنامه دیسکورد ندارد که آن هم یک پلتفرم ارتباطی جداگانه است.
نصب برنامه دیسکورد (اختیاری): برای تجربه کاربری بهتر و دسترسی راحت‌تر، می‌توانید برنامه دسکتاپ دیسکورد را از وب‌سایت رسمی Discord دانلود و نصب کنید. این برنامه صرفاً برای دسترسی به پلتفرم دیسکورد است و نه خود Midjourney. دیسکورد همچنین اپلیکیشن موبایل برای اندروید و iOS دارد.

از طریق وب‌سایت (نسخه آلفا/بتا برای کاربران خاص):

Midjourney در حال توسعه یک رابط کاربری وب است که به کاربران امکان می‌دهد بدون نیاز به دیسکورد، تصاویر را مستقیماً از طریق وب‌سایت اختصاصی Midjourney ایجاد و مدیریت کنند. این قابلیت در حال حاضر ممکن است در مرحله آزمایشی (آلفا یا بتا) باشد و برای همه کاربران در دسترس نباشد یا فقط برای مشترکین پیشرفته فعال باشد. برای اطلاع از وضعیت دسترسی به این پلتفرم جدید و ورود به آن، باید به وب‌سایت رسمی Midjourney مراجعه کرده و وارد حساب کاربری خود شوید.

میدجرنی هم ابزاری برای تولید تصویر است و هم خلاقیت انسان را پرورش می‌دهد. این فناوری به هنرمندان، طراحان، نویسندگان، و حتی افراد عادی این امکان را می‌دهد تا ایده‌های بصری خود را بدون نیاز به مهارت‌های پیچیده نقاشی، طراحی یا مدل‌سازی سه‌بعدی، به واقعیت تبدیل کنند. با ادامه پیشرفت این فناوری، مرزهای آنچه می‌توانیم با هوش مصنوعی خلق کنیم، همچنان گسترش خواهد یافت و دنیایی از امکانات جدید و بی‌سابقه را پیش روی ما قرار خواهد داد. 

 

امتیاز بدهید

نوشته هوش مصنوعی میدجرنی Midjourney چیست و چطور با آن کار کنیم؟ اولین بار در شنبه مگ. پدیدار شد.

Related Posts

نتیجه‌ای پیدا نشد.

فهرست
Generated by Feedzy