8 دقیقه
مدیرعامل Nvidia هشدار داد: نیازهای محاسبات هوش مصنوعی بهسرعت رشد میکند
در یک نشست خبری برجسته و زنده در لاسوگاس، جِنسِن هوانگ، مدیرعامل Nvidia، اعلام کرد که مسابقه برای تأمین محاسبات موردنیاز هوش مصنوعی تشدید شده و تقاضا برای GPUها و زیرساختهای مرتبط با هوش مصنوعی بهسرعت در حال افزایش است. هوانگ این افزایش را یک «مسابقه شدید» برای رسیدن به مرز بعدی توسعههای هوش مصنوعی توصیف کرد و اشاره نمود که پیچیدگی مدلها و نیازهای محاسباتی به صورت نمایی در حال رشد است. این تغییر الگو نشاندهندهی جهشی در عرصه طراحی مدلهای بزرگ زبان، مدلهای بینرشتهای و سیستمهای مولد است که نیازمند توان محاسباتی بیشتر، پهنای باند حافظه بالاتر و معماریهای شتابدهنده پیشرفتهتر هستند. در این گزارش ما به تأثیرات فنی و اقتصادی این موج جدید تقاضا برای GPU، شتابدهندههای AI، دیتاسنترها و اکوسیستم ماینینگ کریپتو میپردازیم.
رشد محاسبات از عرضه پیشی میگیرد
هوانگ توضیح داد که اندازه مدلهای هوش مصنوعی و حجم کاریهای آموزش هر سال تقریباً یک مرتبه توان (یک باس) افزایش مییابد و همین موضوع منجر به افزایش چشمگیر ظرفیت محاسباتی موردنیاز شده است. او گفت: «مقدار محاسبات لازم برای هوش مصنوعی در حال سر به فلک کشیدن است. تقاضا برای GPUهای Nvidia به شدت افزایش یافته است.» این سرعت رشد نه فقط برای تولیدکنندگان چیپ بلکه برای ارائهدهندگان خدمات ابری، شرکتهای بزرگ، استارتاپهای AI و مراکز داده معنی عمیقی دارد؛ چرا که توان، خنکسازی، پهنای باند حافظه (HBM، DDR، NVLink) و فشردهسازی دادهها بهعنوان عوامل تعیینکننده هزینه و قابلیت توسعه اهمیت بیشتری پیدا میکنند. از منظر فنی، افزایش FLOPs مورد نیاز برای آموزش مدلهای بزرگ، فشار بر روی معماریهای شبکهای داده (topology)، ذخیرهسازی سرعت بالا و مدیریت مصرف انرژی را افزایش میدهد.

پیامدها برای ارائهدهندگان ابری، شرکتها و اکوسیستم سختافزار
این گرایش به افزایش تقاضای محاسباتی، نیاز به برنامهریزی سرمایهای گسترده برای ارائهدهندگان ابری (Cloud Providers) و اپراتورهای دیتاسنتر را تشدید میکند. افزایش نیاز به GPUها و شتابدهندههای AI میتواند عرضه را فشرده کند، زمان تحویل (lead time) را طولانیتر کند و هزینههای استقرار زیرساخت را بالا ببرد. شرکتها برای رقابت در حوزه هوش مصنوعی باید استراتژیهای ترکیبی شامل سرمایهگذاری در سختافزار اختصاصی، استفاده از خدمات ابری هیبریدی و بهینهسازی بهرهوری محاسباتی (با نرمافزار و روشهای آموزش کاراتر) را به کار گیرند. این مسأله همچنین اهمیت نرمافزارهای بهینهساز و کتابخانههایی مانند CUDA، TensorRT و چارچوبهای توزیع بار را افزایش میدهد، زیرا کارایی نرمافزار میتواند بهطور مستقیم هزینههای سختافزاری را کاهش دهد و زمان رسیدن به نتایج تحقیقاتی و محصولی را تسریع کند. در نتیجه، بازیگران جدید و سنتی در زنجیره تأمین شامل تولیدکنندگان چیپ، تامینکنندگان حافظه پهنباند بالا (HBM)، سازندگان سرور و شرکتهای خنکسازی مایع توجه بیشتری به نوآوری نشان میدهند.
دلایل فنی افزایش تقاضا: مقیاس مدلها، داده و زمان آموزش
چند عامل فنی باعث شده تا نیاز محاسباتی بهسرعت افزایش یابد: رشد در تعداد پارامترها و پیچیدگی معماریهای Transformer و مدلهای مولد، افزایش اندازه دادههای آموزشی و نیاز به انجام آزمایشهای تکراری و جستجوی هایپرپارامتر که همه نیازمند چرخههای محاسباتی بیشتر هستند. علاوه بر این، توسعه مدلهای چندرسانهای، ریزپردازش (fine-tuning) مداوم روی دادههای خاص حوزه و آزمایشهای بزرگ مقیاس روی آنتروپیهای مختلف پاسخ مدل، همه به انرژی محاسباتی افزوده میشوند. از منظر مهندسی، بهبود نسبت کارایی به مصرف انرژی (performance per watt)، بهرهوری حافظه و کاهش زمان تا نتیجه (time-to-result) از اولویتهای اصلی سازندگان و مصرفکنندگان سختافزار است. این روندها باعث شدهاند تا تقاضا برای GPUهای نسل بعدی، شتابدهندههای مبتنی بر TPU و ASICهای سفارشی برای عملیات ماتریسی افزایش یابد.
تأثیر بر ماینینگ کریپتو و استخراجکنندگان بیتکوین
افزایش تقاضا برای محاسبات هوش مصنوعی توجه بخش کریپتو را نیز جلب کرده است. در دو سال گذشته چندین شرکت استخراج بیتکوین (BTC) بخشی از ظرفیت خود را به کارهای مربوط به AI و تسکهای مبتنی بر GPU اختصاص داده یا به کلی به سمت آن سوق دادهاند. رشد سختی استخراج بیتکوین (Bitcoin mining difficulty) و نوسانات درآمدزایی از استخراج، همراه با امکان کسب درآمد بالاتر یا پایدارتر از طریق ارائه ظرفیت محاسباتی برای آموزش مدلها، انگیزهای قوی برای پیمایش این مسیر فراهم آورده است. این تحول باعث شده تا برخی از اپراتورها که مراکز داده وسیع و خنکسازی صنعتی در اختیار دارند، نسبت به خرید GPU یا توسعه ظرفیت شتابدهندههای AI اقدام کنند تا تنوع درآمدی ایجاد نمایند.
همزمان، با افزایش تقاضای محاسبات AI، برخی استخراجکنندگان ممکن است ترکیب سختافزاری خود را گسترش دهند و GPUها و شتابدهندههای تخصصی AI را به سبد سختافزاریشان اضافه کنند، در حالی که دیگران بخش از ظرفیت بلااستفاده را به مشتریان ابری یا شرکتهای AI اجاره میدهند. این انتقال میتواند روی دسترسی GPUها برای فعالیتهای سنتی استخراج کریپتو اثر بگذارد و احتمال تسریع ادغام بین ارائهدهندگان ابری، شرکتهای AI و زیرساختهای کریپتو را افزایش دهد. همچنین تأثیراتی بر قیمتها، تامین قطعات و دوره بازگشت سرمایه (ROI) مراکز استخراج خواهد داشت.
چیپهای Rubin و Vera انویدیا وعدهی جهشهای عملکردی بزرگی را میدهند
هوانگ نقشه راه Nvidia را نیز تشریح کرد و تأیید نمود که چیپهای نسل بعدی شرکت، با نامهای Rubin و Vera، در خط تولید کامل قرار دارند و طبق برنامه پیش میروند. این دو چیپ که برای کارِ همافزا طراحی شدهاند، به گفته هوانگ میتوانند تا پنج برابر عملکرد محاسباتی هوش مصنوعی نسلهای قبلی را ارائه دهند. افزایش کارایی در سطح پردازش موازی، بهبود پهنای باند حافظه و نوآوری در معماری داخلی از عوامل مهم این جهش عملکردی هستند. چنین پیشرفتی به معنای افزایش نیاز به توان برق دیتاسنتر، حافظه پهنباند بالا (high-bandwidth memory) و سیستمهای خنککننده پیشرفته خواهد بود؛ عواملی که بر استقرار مدلهای بزرگ، هزینههای عملیاتی و محاسبات ابری تأثیر مستقیم میگذارند.
مشکلات زیرساختی و چالشهای عملیاتی
با ورود چیپهایی مانند Rubin و Vera که عملکرد خام بسیار بالاتری ارائه میدهند، تامینکنندگان دیتاسنتر با چالشهای جدیدی مواجه خواهند شد: نیاز به افزایش ظرفیت توزیع برق (PDUs، ترانسفورماتورها)، طراحی مجدد سیستمهای خنکسازی (از جمله خنکسازی مایع مستقیم به تراشه)، بهینهسازی مسیرهای شبکه و فراهمآوری فضای فیزیکی و تهویه مناسب. این تغییرات هزینههای راهاندازی و نگهداری را بالا میبرد و زمانهای توسعه و استقرار را طولانیتر میسازد. در عین حال، برای شرکتهای کوچک و استارتاپهای AI، دسترسی به این سختافزار پیشرفته ممکن است از طریق اجاره سرویسهای ابری یا قراردادهای مشارکتی با ارائهدهندگان زیرساخت تسهیل شود. رقابت بین تولیدکنندگان GPU، شرکتهای راهاندازی مراکز داده و ارائهدهندگان خدمات مدیریت زیرساخت، میتواند منجر به نوآوری در مدلهای قیمتگذاری و سرویسدهی گردد.
نگاهی به آینده: رقابت، ظرفیت و ارتباط با کریپتو
تعامل بین تقاضای محاسبات هوش مصنوعی و استخراج کریپتو همچنان تکامل خواهد یافت. برای ماینرها، ایجاد تعادل بین سرمایهگذاری در ASICهای مخصوص بیتکوین و ظرفیتهای منعطف GPU/شتابدهنده برای AI میتواند یک استراتژی حیاتی شود. از طرف دیگر، برای جامعه گستردهتر کریپتو و بلاکچین، افزایش تقاضا برای زیرساختهای AI ممکن است هزینههای میزبانی (hosting costs)، دسترسی به سختافزار و مدلهای درآمدی بلندمدت را بازتعریف کند. علاوه بر این، بازار ثانویه GPU، سیاستهای صادراتی، محدودیتهای عرضه حافظه و تمرکز تولید در چند کشور میتواند ریسکهای زنجیره تأمین را افزایش دهد و مشوقهایی برای تنوعبخشی جغرافیایی و سرمایهگذاری در تولید داخل بهوجود آورد.
در مجموع پیام انویدیا روشن بود: محاسبه (compute) گلوگاه اصلی است و شرکتهایی که کاراترین و بالاترین ظرفیت GPU و شتابدهنده AI را بهدست آورند، احتمالاً زودتر به پیشرفتهای بزرگ دست خواهند یافت — تحولی که پیامدهای ملموسی برای حوزه هوش مصنوعی، استخراج بیتکوین و اکوسیستم وسیعتر کریپتو خواهد داشت. در شرایطی که رقابت بر سر دسترسی به توان محاسباتی افزایش یافته است، استراتژیهای مدیریتی، توافقات تأمین، و سرمایهگذاریهای زیرساختی نقش تعیینکنندهای در موفقیت بازیگران این بازار ایفا خواهند کرد.
منبع: cointelegraph
نظرات
لابکور
اگه Rubin و Vera واقعا ۵ برابر سرعت دارن، پس دیتاسنترها باید همه چیزو بازطراحی کنن؟ تامین برق و خنککننده رو چه کسی تضمین میکنه؟
دیتاپل
وااای، اینکه همه جا برا GPU صف بکشن عجیب و ترسناکه، شرکتا کوچیک از کجا پول و برق پیدا کنن؟ خیلی استرسزاست...
ارسال نظر