هشدار انویدیا: انفجار تقاضای محاسبات هوش مصنوعی و پیامدها

هشدار انویدیا: انفجار تقاضای محاسبات هوش مصنوعی و پیامدها

2 نظرات

8 دقیقه

مدیرعامل Nvidia هشدار داد: نیازهای محاسبات هوش مصنوعی به‌سرعت رشد می‌کند

در یک نشست خبری برجسته و زنده در لاس‌وگاس، جِنسِن هوانگ، مدیرعامل Nvidia، اعلام کرد که مسابقه برای تأمین محاسبات موردنیاز هوش مصنوعی تشدید شده و تقاضا برای GPUها و زیرساخت‌های مرتبط با هوش مصنوعی به‌سرعت در حال افزایش است. هوانگ این افزایش را یک «مسابقه شدید» برای رسیدن به مرز بعدی توسعه‌های هوش مصنوعی توصیف کرد و اشاره نمود که پیچیدگی مدل‌ها و نیازهای محاسباتی به صورت نمایی در حال رشد است. این تغییر الگو نشان‌دهنده‌ی جهشی در عرصه طراحی مدل‌های بزرگ زبان، مدل‌های بین‌رشته‌ای و سیستم‌های مولد است که نیازمند توان محاسباتی بیشتر، پهنای باند حافظه بالاتر و معماری‌های شتاب‌دهنده پیشرفته‌تر هستند. در این گزارش ما به تأثیرات فنی و اقتصادی این موج جدید تقاضا برای GPU، شتاب‌دهنده‌های AI، دیتاسنترها و اکوسیستم ماینینگ کریپتو می‌پردازیم.

رشد محاسبات از عرضه پیشی می‌گیرد

هوانگ توضیح داد که اندازه مدل‌های هوش مصنوعی و حجم کاری‌های آموزش هر سال تقریباً یک مرتبه توان (یک باس) افزایش می‌یابد و همین موضوع منجر به افزایش چشمگیر ظرفیت محاسباتی موردنیاز شده است. او گفت: «مقدار محاسبات لازم برای هوش مصنوعی در حال سر به فلک کشیدن است. تقاضا برای GPUهای Nvidia به شدت افزایش یافته است.» این سرعت رشد نه فقط برای تولیدکنندگان چیپ بلکه برای ارائه‌دهندگان خدمات ابری، شرکت‌های بزرگ، استارتاپ‌های AI و مراکز داده معنی عمیقی دارد؛ چرا که توان، خنک‌سازی، پهنای باند حافظه (HBM، DDR، NVLink) و فشرده‌سازی داده‌ها به‌عنوان عوامل تعیین‌کننده هزینه و قابلیت توسعه اهمیت بیشتری پیدا می‌کنند. از منظر فنی، افزایش FLOPs مورد نیاز برای آموزش مدل‌های بزرگ، فشار بر روی معماری‌های شبکه‌ای داده (topology)، ذخیره‌سازی سرعت بالا و مدیریت مصرف انرژی را افزایش می‌دهد.

پیامدها برای ارائه‌دهندگان ابری، شرکت‌ها و اکوسیستم سخت‌افزار

این گرایش به افزایش تقاضای محاسباتی، نیاز به برنامه‌ریزی سرمایه‌ای گسترده برای ارائه‌دهندگان ابری (Cloud Providers) و اپراتورهای دیتاسنتر را تشدید می‌کند. افزایش نیاز به GPUها و شتاب‌دهنده‌های AI می‌تواند عرضه را فشرده کند، زمان تحویل (lead time) را طولانی‌تر کند و هزینه‌های استقرار زیرساخت را بالا ببرد. شرکت‌ها برای رقابت در حوزه هوش مصنوعی باید استراتژی‌های ترکیبی شامل سرمایه‌گذاری در سخت‌افزار اختصاصی، استفاده از خدمات ابری هیبریدی و بهینه‌سازی بهره‌وری محاسباتی (با نرم‌افزار و روش‌های آموزش کاراتر) را به کار گیرند. این مسأله همچنین اهمیت نرم‌افزارهای بهینه‌ساز و کتابخانه‌هایی مانند CUDA، TensorRT و چارچوب‌های توزیع بار را افزایش می‌دهد، زیرا کارایی نرم‌افزار می‌تواند به‌طور مستقیم هزینه‌های سخت‌افزاری را کاهش دهد و زمان رسیدن به نتایج تحقیقاتی و محصولی را تسریع کند. در نتیجه، بازیگران جدید و سنتی در زنجیره تأمین شامل تولیدکنندگان چیپ، تامین‌کنندگان حافظه پهن‌باند بالا (HBM)، سازندگان سرور و شرکت‌های خنک‌سازی مایع توجه بیشتری به نوآوری نشان می‌دهند.

دلایل فنی افزایش تقاضا: مقیاس مدل‌ها، داده و زمان آموزش

چند عامل فنی باعث شده تا نیاز محاسباتی به‌سرعت افزایش یابد: رشد در تعداد پارامترها و پیچیدگی معماری‌های Transformer و مدل‌های مولد، افزایش اندازه داده‌های آموزشی و نیاز به انجام آزمایش‌های تکراری و جستجوی هایپرپارامتر که همه نیازمند چرخه‌های محاسباتی بیشتر هستند. علاوه بر این، توسعه مدل‌های چندرسانه‌ای، ریزپردازش (fine-tuning) مداوم روی داده‌های خاص حوزه و آزمایش‌های بزرگ مقیاس روی آنتروپی‌های مختلف پاسخ مدل، همه به انرژی محاسباتی افزوده می‌شوند. از منظر مهندسی، بهبود نسبت کارایی به مصرف انرژی (performance per watt)، بهره‌وری حافظه و کاهش زمان تا نتیجه (time-to-result) از اولویت‌های اصلی سازندگان و مصرف‌کنندگان سخت‌افزار است. این روندها باعث شده‌اند تا تقاضا برای GPUهای نسل بعدی، شتاب‌دهنده‌های مبتنی بر TPU و ASICهای سفارشی برای عملیات ماتریسی افزایش یابد.

تأثیر بر ماینینگ کریپتو و استخراج‌کنندگان بیت‌کوین

افزایش تقاضا برای محاسبات هوش مصنوعی توجه بخش کریپتو را نیز جلب کرده است. در دو سال گذشته چندین شرکت استخراج بیت‌کوین (BTC) بخشی از ظرفیت خود را به کارهای مربوط به AI و تسک‌های مبتنی بر GPU اختصاص داده یا به کلی به سمت آن سوق داده‌اند. رشد سختی استخراج بیت‌کوین (Bitcoin mining difficulty) و نوسانات درآمدزایی از استخراج، همراه با امکان کسب درآمد بالاتر یا پایدارتر از طریق ارائه ظرفیت محاسباتی برای آموزش مدل‌ها، انگیزه‌ای قوی برای پیمایش این مسیر فراهم آورده است. این تحول باعث شده تا برخی از اپراتورها که مراکز داده وسیع و خنک‌سازی صنعتی در اختیار دارند، نسبت به خرید GPU یا توسعه ظرفیت شتاب‌دهنده‌های AI اقدام کنند تا تنوع درآمدی ایجاد نمایند.

هم‌زمان، با افزایش تقاضای محاسبات AI، برخی استخراج‌کنندگان ممکن است ترکیب سخت‌افزاری خود را گسترش دهند و GPUها و شتاب‌دهنده‌های تخصصی AI را به سبد سخت‌افزاری‌شان اضافه کنند، در حالی که دیگران بخش از ظرفیت بلااستفاده را به مشتریان ابری یا شرکت‌های AI اجاره می‌دهند. این انتقال می‌تواند روی دسترسی GPUها برای فعالیت‌های سنتی استخراج کریپتو اثر بگذارد و احتمال تسریع ادغام بین ارائه‌دهندگان ابری، شرکت‌های AI و زیرساخت‌های کریپتو را افزایش دهد. همچنین تأثیراتی بر قیمت‌ها، تامین قطعات و دوره بازگشت سرمایه (ROI) مراکز استخراج خواهد داشت.

چیپ‌های Rubin و Vera انویدیا وعده‌ی جهش‌های عملکردی بزرگی را می‌دهند

هوانگ نقشه راه Nvidia را نیز تشریح کرد و تأیید نمود که چیپ‌های نسل بعدی شرکت، با نام‌های Rubin و Vera، در خط تولید کامل قرار دارند و طبق برنامه پیش می‌روند. این دو چیپ که برای کارِ هم‌افزا طراحی شده‌اند، به گفته هوانگ می‌توانند تا پنج برابر عملکرد محاسباتی هوش مصنوعی نسل‌های قبلی را ارائه دهند. افزایش کارایی در سطح پردازش موازی، بهبود پهنای باند حافظه و نوآوری در معماری داخلی از عوامل مهم این جهش عملکردی هستند. چنین پیشرفتی به معنای افزایش نیاز به توان برق دیتاسنتر، حافظه پهن‌باند بالا (high-bandwidth memory) و سیستم‌های خنک‌کننده پیشرفته خواهد بود؛ عواملی که بر استقرار مدل‌های بزرگ، هزینه‌های عملیاتی و محاسبات ابری تأثیر مستقیم می‌گذارند.

مشکلات زیرساختی و چالش‌های عملیاتی

با ورود چیپ‌هایی مانند Rubin و Vera که عملکرد خام بسیار بالاتری ارائه می‌دهند، تامین‌کنندگان دیتاسنتر با چالش‌های جدیدی مواجه خواهند شد: نیاز به افزایش ظرفیت توزیع برق (PDUs، ترانسفورماتورها)، طراحی مجدد سیستم‌های خنک‌سازی (از جمله خنک‌سازی مایع مستقیم به تراشه)، بهینه‌سازی مسیرهای شبکه و فراهم‌آوری فضای فیزیکی و تهویه مناسب. این تغییرات هزینه‌های راه‌اندازی و نگهداری را بالا می‌برد و زمان‌های توسعه و استقرار را طولانی‌تر می‌سازد. در عین حال، برای شرکت‌های کوچک و استارتاپ‌های AI، دسترسی به این سخت‌افزار پیشرفته ممکن است از طریق اجاره سرویس‌های ابری یا قراردادهای مشارکتی با ارائه‌دهندگان زیرساخت تسهیل شود. رقابت بین تولیدکنندگان GPU، شرکت‌های راه‌اندازی مراکز داده و ارائه‌دهندگان خدمات مدیریت زیرساخت، می‌تواند منجر به نوآوری در مدل‌های قیمت‌گذاری و سرویس‌دهی گردد.

نگاهی به آینده: رقابت، ظرفیت و ارتباط با کریپتو

تعامل بین تقاضای محاسبات هوش مصنوعی و استخراج کریپتو همچنان تکامل خواهد یافت. برای ماینرها، ایجاد تعادل بین سرمایه‌گذاری در ASICهای مخصوص بیت‌کوین و ظرفیت‌های منعطف GPU/شتاب‌دهنده برای AI می‌تواند یک استراتژی حیاتی شود. از طرف دیگر، برای جامعه گسترده‌تر کریپتو و بلاک‌چین، افزایش تقاضا برای زیرساخت‌های AI ممکن است هزینه‌های میزبانی (hosting costs)، دسترسی به سخت‌افزار و مدل‌های درآمدی بلندمدت را بازتعریف کند. علاوه بر این، بازار ثانویه GPU، سیاست‌های صادراتی، محدودیت‌های عرضه حافظه و تمرکز تولید در چند کشور می‌تواند ریسک‌های زنجیره تأمین را افزایش دهد و مشوق‌هایی برای تنوع‌بخشی جغرافیایی و سرمایه‌گذاری در تولید داخل به‌وجود آورد.

در مجموع پیام انویدیا روشن بود: محاسبه (compute) گلوگاه اصلی است و شرکت‌هایی که کاراترین و بالاترین ظرفیت GPU و شتاب‌دهنده AI را به‌دست آورند، احتمالاً زودتر به پیشرفت‌های بزرگ دست خواهند یافت — تحولی که پیامدهای ملموسی برای حوزه هوش مصنوعی، استخراج بیت‌کوین و اکوسیستم وسیع‌تر کریپتو خواهد داشت. در شرایطی که رقابت بر سر دسترسی به توان محاسباتی افزایش یافته است، استراتژی‌های مدیریتی، توافقات تأمین، و سرمایه‌گذاری‌های زیرساختی نقش تعیین‌کننده‌ای در موفقیت بازیگران این بازار ایفا خواهند کرد.

منبع: cointelegraph

ارسال نظر

نظرات

لابکور

اگه Rubin و Vera واقعا ۵ برابر سرعت دارن، پس دیتاسنترها باید همه چیزو بازطراحی کنن؟ تامین برق و خنک‌کننده رو چه کسی تضمین می‌کنه؟

دیتاپل

وااای، اینکه همه جا برا GPU صف بکشن عجیب و ترسناکه، شرکتا کوچیک از کجا پول و برق پیدا کنن؟ خیلی استرس‌زاست...

مطالب مرتبط