با بهرهوری از هوش مصنوعی، دیگر خلق کردن تصاویر خارقالعاده و چشمگیر منحصر به هنرمندان نیست و همه میتوانند با نوشتن چند خط پرامپت استاندارد در هوش مصنوعی midjourney تصاویری منحصربهفرد خلق کنند.
این ابزار قدرتمند هم برای افراد حرفهای در حوزه هنر و طراحی و هم برای هر کسی که به دنبال بیان بصری ایدههای خود است، یک انقلاب به شمار میرود. از ایدههای تبلیغاتی و طراحی مفهومی گرفته تا ساخت تصاویر پروفایل و هنرهای شخصی، Midjourney افقهای جدیدی را پیش روی ما گشوده است. در این مقاله جامع، به بررسی عمیق Midjourney، نحوه کار با آن، دستورات کاربردی و پیشرفته، مقایسه آن با سایر ابزارهای مشابه و نگاهی به آینده این فناوری میپردازیم.
هوش مصنوعی میدجرنی (midjourney) چیست؟
هوش مصنوعی midjourney یک برنامه هوش مصنوعی مولد است که به طور خاص برای تولید تصاویر از توصیفات متنی (Text-to-Image) طراحی شده است. این ابزار پیشرفته، بر اساس مدلهای یادگیری عمیق پیچیده (مانند شبکههای عصبی و ترانسفورمرها) کار میکند که توانایی شگفتانگیزی در درک و ترجمه کلمات به مفاهیم بصری را دارند. به زبان سادهتر، شما ایدههای خود را به زبان طبیعی و نوشتاری بیان میکنید و Midjourney آن را به یک اثر هنری بصری تبدیل میکند. این فناوری توسط آزمایشگاه تحقیقاتی مستقل Midjourney Inc. توسعه یافته و از طریق یک ربات دیسکورد (Discord bot) در دسترس قرار میگیرد. این روش دسترسی، به کاربران امکان میدهد به راحتی و از طریق یک پلتفرم ارتباطی محبوب، با این هوش مصنوعی تعامل داشته باشند.
آموزش ساخت تصویر با هوش مصنوعی midjourney
برای شروع کار با Midjourney و خلق اولین تصاویر خود، باید مراحل سادهای را دنبال کنید. همانطور که پیشتر اشاره شد، Midjourney عمدتاً از طریق دیسکورد کار میکند و شما با استفاده از دستورات متنی با ربات Midjourney تعامل خواهید داشت.
مراحل گام به گام:
عضویت در دیسکورد: اگر هنوز حساب کاربری در دیسکورد ندارید، ابتدا یک حساب رایگان و سریع در وبسایت Discord ایجاد کنید. دیسکورد یک پلتفرم چت و ارتباطی محبوب است که برای گروههای مختلف، از جمله جامعه Midjourney، استفاده میشود.
پیوستن به سرور Midjourney: پس از ایجاد حساب دیسکورد، به وبسایت رسمی Midjourney (midjourney.com) مراجعه کنید. در این صفحه، دکمهای با عنوان “Join the Beta” یا “Sign In” وجود دارد. با کلیک بر روی آن، شما به سرور دیسکورد رسمی Midjourney هدایت میشوید.
پذیرفتن قوانین و مقررات: پس از ورود به سرور، معمولاً لازم است قوانین و شرایط استفاده از Midjourney را مطالعه و بپذیرید. این مرحله برای اطمینان از محیطی امن و مناسب برای همه کاربران ضروری است.
ورود به کانالهای تولید تصویر: در نوار کناری سمت چپ دیسکورد، لیستی از کانالها را مشاهده خواهید کرد. به یکی از کانالهایی که برای تولید تصویر در نظر گرفته شدهاند، مانند کانالهای “newbies” (تازهکاران) یا کانالهای مشابه با نامهای عددی (مثلاً newbies-1, newbies-2 و غیره) بروید. این کانالها محیطی برای شروع کار و آزمایش دستورات هستند.
استفاده از دستور اصلی /imagine: برای آغاز فرآیند تولید تصویر، در کادر پیامرسان دیسکورد، دستور /imagine را تایپ کنید. پس از تایپ این دستور و فشار دادن کلید Space یا Enter، یک فیلد متنی به نام prompt ظاهر میشود.
وارد کردن Prompt (توصیف متنی) ایدهآل شما: در فیلد prompt، توصیف دقیق و خلاقانه خود را از تصویری که میخواهید ایجاد کنید. این توصیف، کلید اصلی برای رسیدن به نتیجه دلخواه شماست. هرچه توصیف شما دقیقتر، جزئیتر و غنیتر باشد، Midjourney میتواند تصویر مطلوبتری را برای شما خلق کند.
مثال: فرض کنید میخواهید تصویری از “یک قصر باستانی شناور در آسمان، احاطه شده با ابرهای صورتی و بنفش در هنگام طلوع آفتاب، با سبک فانتزی حماسی و جزئیات فراوان” بسازید.
تایید و تولید تصویر: پس از وارد کردن توصیف، کلید Enter را فشار دهید. ربات Midjourney شروع به پردازش درخواست شما میکند. این فرآیند بسته به پیچیدگی توصیف و ترافیک سرور، ممکن است چند ثانیه تا یک دقیقه طول بکشد. در نهایت، Midjourney چهار تصویر اولیه را بر اساس توصیف شما تولید میکند.
انتخاب و ویرایش تصاویر (Upscale و Variations): زیر چهار تصویر تولید شده، دکمههایی با برچسبهای U1, U2, U3, U4 و V1, V2, V3, V4 مشاهده خواهید کرد:
U (Upscale – افزایش وضوح): با کلیک روی هر دکمه U (به عنوان مثال U1 برای تصویر بالا سمت چپ)، Midjourney نسخه با وضوح بالاتر و جزئیات بیشتر (Upscale) از آن تصویر خاص را تولید میکند. این نسخه برای استفاده نهایی مناسبتر است.
V (Variations – ایجاد تنوع): با کلیک روی هر دکمه V (به عنوان مثال V1 برای تصویر بالا سمت چپ)، Midjourney چهار نسخه جدید و متفاوت از آن تصویر را بر اساس سبک و محتوای آن تولید میکند. این گزینه برای کاوش ایدههای جدید یا بهبود نتایج اولیه بسیار مفید است.
Refresh (فلش دایرهای): این دکمه به شما امکان میدهد تا چهار تصویر جدید را بر اساس همان توصیف اولیه تولید کنید، که میتواند منجر به نتایج کاملاً جدیدی شود.
دستورات کاربردی هوش مصنوعی میدجرنی
Midjourney مجموعهای غنی از دستورات و پارامترها را ارائه میدهد که به شما امکان میدهد کنترل بینظیری بر روی خروجی نهایی داشته باشید. این دستورات پس از توصیف اصلی و با — اضافه میشوند.
دستورات پرکاربرد و ضروری:
–ar <عرض>:<ارتفاع> (نسبت تصویر): این دستور یکی از پرکاربردترین پارامترهاست و نسبت عرض به ارتفاع تصویر را تعیین میکند.
مثال: برای یک تصویر عریض که مثلاً برای پسزمینه دسکتاپ مناسب باشد، مانند “یک منظره کوهستانی باشکوه با رودخانهای خروشان”، از –ar 16:9 استفاده کنید. (مثال کامل: /imagine prompt یک منظره کوهستانی باشکوه با رودخانه ای خروشان –ar 16:9)
مثال: برای یک تصویر عمودی که برای داستانهای اینستاگرام یا پسزمینه گوشی مناسب باشد، مانند “پرترهای از یک زن با کلاه بزرگ”، از –ar 2:3 یا –ar 9:16 استفاده کنید.
–v <نسخه> (نسخه مدل): Midjourney به طور مداوم نسخههای جدیدی از مدل هوش مصنوعی خود را منتشر میکند. هر نسخه دارای ویژگیها، سبکها و تواناییهای خاص خود در درک و تولید تصویر است.
مثال: برای استفاده از جدیدترین و پیشرفتهترین نسخه برای “یک جنگل پریان عجیب و غریب با قارچهای درخشان”، از –v 6.0 استفاده کنید. (مثال کامل: /imagine prompt یک جنگل پریان عجیب و غریب با قارچ های درخشان –v 6.0)
توجه: نسخه 6.0 (V6) در زمان حال، جدیدترین و پیشرفتهترین نسخه است و قابلیت درک بهتر توصیفات و جزئیات بیشتر را دارد.
–style <raw> (سبک خام): این پارامتر که از نسخه V6 به بعد معرفی شده، به شما اجازه میدهد خروجی خامتر و کمتر “استایلدار” را دریافت کنید. این حالت کنترل بیشتری بر روی جزئیات و واقعگرایی میدهد و از اعمال سبک پیشفرض Midjourney میکاهد.
مثال: برای “یک فانوس دریایی قدیمی در ساحل طوفانی” با تمرکز بر جزئیات واقعگرایانه و بدون سبکپردازی زیاد، از –style raw استفاده کنید.
–seed <عدد> (سید یا بذر): با استفاده از یک عدد سید خاص (مثلاً 12345)، میتوانید تولید تصاویری با نتایج بسیار مشابه در دفعات بعدی را تضمین کنید. این برای آزمایش و بهبود توصیف، یا تولید تغییرات جزئی بر اساس یک تصویر اولیه بسیار مفید است.
مثال: اگر تصویری از “یک درخت گیلاس شکوفا” با سید 12345 تولید کردهاید و میخواهید تغییرات کوچکی در آن ایجاد کنید، میتوانید همان سید را دوباره استفاده کنید.
–no <کلمه یا عبارت> (حذف عنصر): این دستور به شما اجازه میدهد تا عناصر خاصی را که نمیخواهید در تصویر نهایی ظاهر شوند، حذف کنید.
مثال: برای “یک باغ زیبا بدون گلهای قرمز”، از –no گلهای قرمز استفاده کنید.
–quality <0.25 | 0.5 | 1 | 2> (کیفیت تصویر): این پارامتر میزان زمان صرف شده برای پردازش و تولید تصویر و در نتیجه کیفیت آن را کنترل میکند. کیفیتهای بالاتر (مانند 1 یا 2) زمان بیشتری میبرند و اعتبار بیشتری مصرف میکنند، اما جزئیات و وضوح بیشتری دارند.
مثال: برای “یک پرتره با جزئیات بسیار بالا از یک پیرمرد با چروکهای صورت مشخص”، از –quality 2 استفاده کنید.
–stylize <عدد> (میزان سبکسازی): این پارامتر میزان “هنری” بودن و “زیبایی” تصویر را کنترل میکند. مقادیر بالاتر منجر به تصاویر با جزئیات بیشتر، هنریتر و اغلب با رنگهای زندهتر میشوند، اما ممکن است از توصیف اصلی کمی فاصله بگیرند.
مثال: برای “یک منظره آرام” با سبکسازی هنریتر، از –stylize 1000 استفاده کنید (مقدار پیشفرض 100 است).
–chaos <عدد> (میزان آشفتگی/تنوع): این پارامتر میزان تنوع در نتایج اولیه را کنترل میکند. مقادیر بالاتر منجر به نتایج متنوعتر و غیرقابل پیشبینیتر در چهار تصویر اولیه میشوند، که برای کشف ایدههای جدید مفید است.
مثال: برای “یک وسیله نقلیه آیندهنگر” که میخواهید تنوع زیادی در طرحهای اولیه آن ببینید، از –chaos 50 استفاده کنید.
/blend (ترکیب تصاویر): این دستور به شما امکان میدهد چندین تصویر (معمولاً 2 تا 5 تصویر) را با هم ترکیب کنید تا یک تصویر جدید با الهام از هر دو ایجاد شود.
نحوه استفاده: کافیست /blend را تایپ کرده و سپس تصاویری را که میخواهید ترکیب کنید، آپلود نمایید.
/settings: این دستور یک منوی تنظیمات شخصی را نمایش میدهد که میتوانید تنظیمات پیشفرض خود را برای کیفیت، سبکسازی و نسخه مدل تغییر دهید تا مجبور نباشید هر بار این پارامترها را وارد کنید.
مقایسه ویژگی های هوش مصنوعی midjourney و DALL-E
Midjourney و DALL-E (که توسط شرکت OpenAI توسعه یافته است) دو رقیب اصلی و قدرتمند در زمینه تولید تصویر از متن هستند. هر دو ابزار قابلیتهای چشمگیری دارند، اما تفاوتهای کلیدی در رویکرد، قابلیتها و نوع خروجی نهایی آنها وجود دارد که درک آنها برای انتخاب ابزار مناسب ضروری است.
سبک هنری و زیباییشناسی:
Midjourney به طور خاص در تولید تصاویری با سبک هنری قوی و زیبا شناسی خاص سرآمد است. خروجیهای آن اغلب فانتزی، سورئال، حماسی، و با اتمسفر و حس و حال عمیق هستند. تصاویر Midjourney اغلب بسیار واقعگرا، سینمایی و با نورپردازی و رنگبندی چشمنواز هستند. اگر به دنبال خلق آثار هنری خیرهکننده با سبک منحصر به فرد هستید، Midjourney انتخاب اول شما خواهد بود.
DALL-E در مقابل، خروجیهای متنوعتر و واقعگرایانهتر را ارائه میدهد، با تاکید بیشتر بر دقت در بازتولید عناصر و مفاهیم. این ابزار معمولاً برای تولید تصاویر محصول، گرافیکهای سادهتر، یا تصاویری که نیاز به دقت بالا در جزئیات و منطبق با توصیف دقیق دارند، کاربرد بیشتری پیدا میکند. DALL-E تلاش میکند تا هر چیزی را که شما توصیف میکنید، دقیقاً همانطور که هست، به تصویر بکشد.
دقت در درک توصیف و کنترلپذیری:
Midjourney برای دستیابی به نتایج مطلوب، نیاز به توصیفات خلاقانه و تا حدودی انتزاعی دارد. درک آن از مفاهیم و حالات انتزاعی قوی است و از پارامترهای متعدد برای کنترل نسبت تصویر، سبک، کیفیت و میزان آشفتگی پشتیبانی میکند که به کاربران اجازه میدهد تا حد زیادی بر خروجی نهایی تأثیر بگذارند.
DALL-E درک بسیار قوی از دستورات دقیق و پیچیده دارد و توانایی تولید تصاویر با جزئیات دقیق بر اساس توضیحات را به خوبی انجام میدهد. همچنین، DALL-E کنترلهای دقیقی برای قابلیتهایی مانند “Inpainting” (تغییر یا جایگزینی بخشی از تصویر) و “Outpainting” (گسترش تصویر موجود فراتر از مرزهای اولیه آن) ارائه میدهد که برای ویرایش تصاویر موجود بسیار کارآمد است.
رابط کاربری و دسترسی:
Midjourney عمدتاً از طریق دیسکورد و با استفاده از دستورات متنی کار میکند. این روش ممکن است برای کاربران جدید کمی ناآشنا باشد و نیاز به عادت کردن دارد.
DALL-E معمولاً از طریق یک رابط کاربری وب ساده و بصری در دسترس است که استفاده از آن را برای کاربران عمومی و بدون دانش قبلی از دستورات، آسانتر میکند.
سرعت تولید و مدلهای کسب و کار:
Midjourney معمولاً در تولید چهار تصویر اولیه سریع عمل میکند، اما عملیات Upscale (افزایش وضوح) ممکن است کمی زمانبر باشد. این سرویس دارای پلنهای اشتراکی ماهانه یا سالانه با سطوح مختلف دسترسی و سرعت است.
DALL-E معمولاً سرعت بالایی در تولید تصاویر دارد و از سیستم اعتباری (Credit-based) استفاده میکند که با خرید اعتبار میتوانید تصاویر تولید کنید.
جامعه کاربری و بهروزرسانیها:
Midjourney دارای یک جامعه بسیار فعال و پرشور در دیسکورد است که کاربران به طور مداوم آثار و نکات خود را به اشتراک میگذارند. بهروزرسانیهای مکرر با نسخههای جدید مدل (مانند V6) نیز از ویژگیهای آن است.
DALL-E نیز جامعه کاربری فعالی دارد، اما کمتر بر جنبههای هنری متمرکز است و بیشتر برای کاربردهای تجاری و گرافیکی استفاده میشود. این ابزار نیز بهروزرسانیهای منظم و معرفی قابلیتهای جدید را ارائه میدهد.
اگر هدف اصلی شما خلق آثار هنری بصری خیرهکننده، فانتزی، سورئال، یا تصاویر سینمایی با سبک و اتمسفر خاص است و از آزمایش با توصیفات و پارامترها لذت میبرید، Midjourney بدون شک انتخاب بهتری است. اما اگر به دقت بالا در بازتولید اشیاء، تولید تصاویر محصول، یا قابلیتهای پیشرفته ویرایش و گسترش تصاویر موجود نیاز دارید، DALL-E ممکن است مناسبتر باشد. بسیاری از کاربران پیشرفته و حرفهای در حوزه طراحی و هنر دیجیتال، از هر دو ابزار برای اهداف مختلف استفاده میکنند، زیرا هر کدام نقاط قوت منحصر به فرد خود را دارند و میتوانند مکمل یکدیگر باشند.
دانلود هوش مصنوعی midjourney
هوش مصنوعی midjourney به معنای واقعی کلمه یک “نرمافزار قابل دانلود” نیست. همانطور که قبلاً اشاره شد، Midjourney یک سرویس مبتنی بر ابر (Cloud-based Service) است. این بدان معناست که هسته اصلی هوش مصنوعی و پردازشهای سنگین آن بر روی سرورهای قدرتمند Midjourney در اینترنت انجام میشود و نتایج به کاربران ارسال میگردد. شما به جای “دانلود” و نصب یک نرمافزار، به این سرویس “دسترسی“ پیدا میکنید.
نحوه دسترسی به Midjourney:
از طریق دیسکورد (رایجترین و اصلیترین راه):
عضویت در سرور دیسکورد Midjourney: این ابتداییترین و رایجترین راه دسترسی است. شما با پیوستن به سرور رسمی Midjourney در دیسکورد، میتوانید از طریق ربات Midjourney در کانالهای مشخص شده، با آن تعامل داشته باشید و دستورات خود را برای تولید تصویر ارسال کنید. این فرآیند نیاز به هیچ “دانلود” نرمافزاری جز خود برنامه دیسکورد ندارد که آن هم یک پلتفرم ارتباطی جداگانه است.
نصب برنامه دیسکورد (اختیاری): برای تجربه کاربری بهتر و دسترسی راحتتر، میتوانید برنامه دسکتاپ دیسکورد را از وبسایت رسمی Discord دانلود و نصب کنید. این برنامه صرفاً برای دسترسی به پلتفرم دیسکورد است و نه خود Midjourney. دیسکورد همچنین اپلیکیشن موبایل برای اندروید و iOS دارد.
از طریق وبسایت (نسخه آلفا/بتا برای کاربران خاص):
Midjourney در حال توسعه یک رابط کاربری وب است که به کاربران امکان میدهد بدون نیاز به دیسکورد، تصاویر را مستقیماً از طریق وبسایت اختصاصی Midjourney ایجاد و مدیریت کنند. این قابلیت در حال حاضر ممکن است در مرحله آزمایشی (آلفا یا بتا) باشد و برای همه کاربران در دسترس نباشد یا فقط برای مشترکین پیشرفته فعال باشد. برای اطلاع از وضعیت دسترسی به این پلتفرم جدید و ورود به آن، باید به وبسایت رسمی Midjourney مراجعه کرده و وارد حساب کاربری خود شوید.
میدجرنی هم ابزاری برای تولید تصویر است و هم خلاقیت انسان را پرورش میدهد. این فناوری به هنرمندان، طراحان، نویسندگان، و حتی افراد عادی این امکان را میدهد تا ایدههای بصری خود را بدون نیاز به مهارتهای پیچیده نقاشی، طراحی یا مدلسازی سهبعدی، به واقعیت تبدیل کنند. با ادامه پیشرفت این فناوری، مرزهای آنچه میتوانیم با هوش مصنوعی خلق کنیم، همچنان گسترش خواهد یافت و دنیایی از امکانات جدید و بیسابقه را پیش روی ما قرار خواهد داد.
نوشته هوش مصنوعی میدجرنی Midjourney چیست و چطور با آن کار کنیم؟ اولین بار در شنبه مگ. پدیدار شد.
آخرین دیدگاهها