استارتاپ Niv-AI با بهره گیری از حسگرهای دقیق و مدل های هوش مصنوعی، راهکاری برای بهبود عملکرد برق GPU و مدیریت نوسانات شدید انرژی در مراکز داده ارائه کرده است تا بهره وری پردازنده های گرافیکی افزایش یابد.
برق یک ماده اولیه حیاتی برای هوش مصنوعی است، اما تکنیک های پردازشی جدید آن قدر سریع پیشرفت کرده اند که اپراتورهای مراکز داده دیگر نمی توانند رابطه شان را با شبکه برق به خوبی مدیریت کنند و مجبور می شوند تا 30 درصد از توان سیستم کم کنند. این وضعیت اهمیت بهبود عملکرد برق GPU را بیش از پیش نمایان می کند.
جن سون هوانگ، مدیرعامل انویدیا، در سخنرانی اصلی کنفرانس سالانه مشتریان GTC گفت: «در این کارخانه های هوش مصنوعی، انرژی خیلی زیادی هدر می رود.» این شرکت در ارائه سالانه اش اعلام کرد: «هر واتی که استفاده نشود، یعنی سودی است که از دست رفته.»
چرا بهبود عملکرد برق GPU حیاتی است؟
امروز استارتاپ Niv-AI با جذب 12 میلیون دلار سرمایه اولیه، از حالت مخفیانه خارج شد تا با استفاده از حسگرهای جدید و اندازه گیری دقیق مصرف برق GPU و توسعه ابزارهایی برای مدیریت بهینه تر آن، مشکل نیاز به بهبود عملکرد برق GPU را حل کند.
این استارتاپ که مقر اصلیش در تل آویو است، سال گذشته (1402) توسط تومر تیمور (مدیرعامل) و ادوارد کیزیس (مدیر فنی) تاسیس شد و شرکت هایی مثل Glilot Capital، Grove Ventures، Arc VC، Encoded VC، Leap Forward و Aurora Capital Partners از آن حمایت می کنند. این شرکت فعلا ارزش بازار خودش را اعلام نکرده است.
از آنجایی که آزمایشگاه های پیشرو از هزاران GPU به صورت همزمان برای آموزش و اجرای مدل های پیشرفته استفاده می کنند، وقتی پردازنده ها بین کارهای محاسباتی و ارتباط با بقیه GPUها جابجا می شوند، نوسانات شدیدی در تقاضای برق در مقیاس میلی ثانیه اتفاق می افتد که نیاز به بهبود عملکرد برق GPU را تشدید می کند.
این نوسانات باعث می شود مدیریت برقی که مراکز داده از شبکه می گیرند سخت شود. برای اینکه بی-برق نمانند، مراکز داده یا هزینه توسعه ذخیره سازی انرژی در آمریکا را می پردازند تا نوسانات را پوشش دهند، یا اینکه مجبور می شوند استفاده از GPUهای خود را محدود کنند. بهبود عملکرد برق GPU می تواند این محدودیت ها را کاهش دهد و بازگشت سرمایه روی تراشه های گران قیمت را افزایش دهد.
لیور هندلزمن، یکی از شرکای Grove Ventures که عضو هیئت مدیره Niv هم هست، می گوید: «ما دیگر نمی توانیم مراکز داده را به همان شکلی که تا حالا می ساختیم، بسازیم.»
Niv-AI و راهکارهایی برای بهبود عملکرد برق GPU
اولین قدم در نقشه راه Niv، فهمیدن این است که دقیقا چه اتفاقی دارد می افتد؛ این شرکت الان حسگرهایی را در سطح رک نصب می کند که مصرف برق را در سطح میلی ثانیه روی GPUهای خود و شرکای طراحش اندازه گیری می کنند. هدف این است که الگوهای مصرف برق خاص برای کارهای مختلف یادگیری عمیق شناسایی شود و تکنیک هایی برای کاهش نوسانات ابداع شود تا مراکز داده بتوانند از ظرفیت فعلی خود بیشتر استفاده کنند و به بهبود عملکرد برق GPU کمک کنند.
طبیعتا مهندس ها قصد دارند بر اساس داده هایی که جمع می کنند، یک مدل هوش مصنوعی بسازند تا بتواند بارهای الکتریکی را در کل مرکز داده پیش بینی و هماهنگ کند؛ در واقع یک «کمک خلبان» برای مهندس های مرکز داده.
شرکت Niv انتظار دارد تا 6 الی 8 ماه آینده، سیستمش را در چندتا از مراکز داده آمریکا عملیاتی کند. این ایده بسیار جذاب است، زیرا غول های تکنولوژی که دنبال ساخت مراکز داده جدید هستند، با مشکلاتی مثل کاربری زمین و چالش های زنجیره تامین روبرو هستند. با تمرکز بر بهبود عملکرد برق GPU، مؤسسان این شرکت محصول نهایی خود را به عنوان آن «لایه هوشمند» گمشده بین مراکز داده و شبکه برق می بینند.
تیمور به تک کرانچ گفت: «شبکه برق در واقع از این می ترسد که مراکز داده در یک زمان خاص، برق خیلی زیادی مصرف کنند. مشکلی که ما داریم روی آن کار می کنیم مثل طنابی است که دو سر دارد. یک سرش این است که به مراکز داده کمک کنیم تا از GPUهای بیشتری استفاده کنند و امیدواریم از برقی که بابتش پول دادند، بهره وری بیشتری داشته باشند. این امر مستقیما به بهبود عملکرد برق GPU کمک می کند. از طرف دیگر، می توان الگوهای مصرف برق خیلی مسئولانه تری بین مراکز داده و شبکه برق ایجاد کرد.»
مدیریت هوشمند انرژی در عصر هوش مصنوعی به یک ضرورت انکارناپذیر تبدیل شده است. با توسعه فناوری های پایش لحظه ای، مراکز داده می توانند بدون فشار به شبکه سراسری، از حداکثر پتانسیل سخت افزارهای خود استفاده کرده و پایداری عملیاتی را در پروژه های سنگین محاسباتی تضمین کنند.
Niv-AI exits stealth to wring more power performance out of GPUs