پژوهشهای جدید نشان میدهد حس ناآرامی و «غیرطبیعی» که بسیاری از ما هنگام دیدن تصاویر تولیدشده با هوش مصنوعی تجربه میکنیم، کاملاً بیدلیل نیست. برخلاف تصور رایج، هوش مصنوعی در تولید تصاویر خلاقانه دچار محدودیت جدی است و تمایل دارد بارها و بارها به الگوهای تکراری بازگردد.

مطالعهای تازه که در ژورنال علمی Patterns منتشر شده، نشان میدهد مدلهای تولید تصویر مبتنی بر هوش مصنوعی، در نهایت تنها به حدود ۱۲ موتیف بصری تکرارشونده محدود میشوند. نتیجهی این روند، تصاویری است که پژوهشگران از آن با عنوان «موسیقی آسانسوریِ بصری» یاد میکنند؛ تصاویری بیروح، فرمولمحور و شبیه به استوکهای شرکتی کمالهام.
در این تحقیق، پژوهشگران یک آزمایش شبیه بازی «تلفن خراب» انجام دادند. دو مدل هوش مصنوعی Stable Diffusion XL و LLaVA بهصورت رفتوبرگشتی، طی ۱۰۰ مرحله، تصاویر یکدیگر را توصیف و بازتولید کردند. هرچند بهمرور از پرامپت اولیه فاصله گرفتند، اما نکتهی قابلتوجه این بود که خروجیها بهطور مداوم به مجموعهای محدود از کلیشههای بصری بازمیگشتند.
این موتیفهای پرتکرار شامل مناظر روستایی آرام، شبهای بارانی، سواحل خلوت، فضاهای داخلی لوکس و ترکیبهای آشنای نورپردازی سینمایی بودند؛ تصاویری که شباهت زیادی به سادهترین و بیخلاقیتترین نمونههای تصاویر تبلیغاتی دارند. بررسی بیش از هزار تکرار نشان داد که هوش مصنوعی در ایجاد تنوع بصری واقعی ناتوان است و به کلیشههایی عمدتاً غربمحور متکی میماند.

اگرچه پیشتر نیز درباره مشکل تنوع در سیستمهای هوش مصنوعی صحبت شده بود، اما محدود شدن خروجیها به تنها ۱۲ الگوی مشخص، زنگ خطری جدی به شمار میرود. در شرایطی که فضای دیجیتال پر از تبلیغات و آثار تولیدشده با AI شده، این یافتهها بار دیگر اهمیت هنر انسانی، نگاه خلاق و تجربه زیسته هنرمندان را یادآوری میکند.
در نهایت، این پژوهش نشان میدهد که هرچند هوش مصنوعی میتواند ابزار مفیدی برای افزایش بهرهوری باشد، اما در زمینه خلاقیت اصیل و بیان هنری، همچنان فاصلهی قابلتوجهی با انسان دارد.

