دانش جوین
شنبه, تیر ۲۱, ۱۴۰۴
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
  • ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی هوش مصنوعی

انویدیا از فناوری Helix برای بهبود سرعت و پاسخگویی هوش مصنوعی رونمایی کرد

دیجیاتو توسط دیجیاتو
۲۰ تیر ۱۴۰۴
در هوش مصنوعی
زمان خواندن: زمان موردنیاز برای مطالعه: 2 دقیقه
0
انویدیا از فناوری Helix برای بهبود سرعت و پاسخگویی هوش مصنوعی رونمایی کرد
1
بازدیدها
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

انویدیا از یک تکنیک موازی‌سازی به نام «هلیکس پاراللیسم» (Helix Parallelism) پرده برداشته است که به مدل‌های هوش مصنوعی اجازه می‌دهد تا حجم عظیمی از اطلاعات را پردازش کنند و با همان سرعت به‌طور همزمان به ۳۲ برابر کاربر بیشتر پاسخ دهند. این فناوری به‌طور ویژه برای معماری پردازشگر‌های گرافیکی جدید بلک‌ول (Blackwell) طراحی شده است.

با بزرگ‌تر و پیچیده‌تر شدن مدل‌های هوش مصنوعی، یکی از مهم‌ترین مسائل آنها توانایی پردازش حجم عظیمی از اطلاعات زمینه (Context) در هنگام تولید پاسخ‌های آنی است. اکنون انویدیا با معرفی Helix Parallelism راه‌حلی برای این مشکل ارائه کرده است.

معرفی فناوری Helix انویدیا

مدل‌های زبان بزرگ برای تولید هر کلمه جدید، با دو چالش اساسی روبه‌رو هستند:

  1. آنها باید به‌طور مداوم کل تاریخچه مکالمه (که در حافظه‌ای به نام KV Cache ذخیره شده) را اسکن کنند که این فرایند پهنای باند حافظه پردازشگر گرافیکی (GPU) را به شدت تحت فشار قرار می‌دهد.
  2. همزمان، برای پردازش هر کلمه، باید وزن‌های عظیم «شبکه عصبی پیشخور» (FFN) از حافظه بارگذاری شوند که این امر باعث کندی و افزایش تأخیر، به‌ویژه در کاربردهای آنی و زنده مانند چت‌بات‌ها می‌شود.
Helix انویدیا

فناوری هلیکس با یک رویکرد هوشمندانه، این دو فرایند را از هم جدا و به صورت بهینه مدیریت می‌کند:

  • موازی‌سازی KV: در مرحله اول، هلیکس به‌جای کپی‌کردن کل حافظه مکالمه (KV Cache) روی تمام GPUها، آن را به صورت هوشمندانه بین پردازنده‌های مختلف تقسیم می‌کند. این کار از تکرار بیهوده داده‌ها جلوگیری می‌کند و فشار روی حافظه را به شدت کاهش می‌دهد.
  • استفاده مجدد از منابع: در مرحله بعد، همان GPUها بلافاصله وظیفه خود را تغییر می‌دهند و با استفاده از روش «موازی‌سازی تنسوری» (TP) به پردازش لایه FFN می‌پردازند. این جابه‌جایی هوشمندانه باعث می‌شود پردازنده‌ها همیشه فعال باقی بمانند و زمان بیکاری به حداقل برسد.

این فرایند پیچیده با استفاده از فناوری‌های اتصال پرسرعت انویدیا مانند NVLink و NVL72 و همچنین تکنیکی به نام HOP-B ممکن شده است.

نتایج شبیه‌سازی‌ها با یک مدل زبانی بزرگ، عملکرد فوق‌العاده این فناوری را به اثبات رسانده است؛ هلیکس می‌تواند با حفظ همان سرعت و تأخیر، به ۳۲ برابر کاربر بیشتر به‌صورت همزمان سرویس‌ بدهد. همچنین در شرایط بار کاری کمتر، زمان پاسخگویی (تأخیر بین تولید هر کلمه) تا ۱.۵ برابر کاهش می‌یابد.

این پیشرفت به این معناست که دستیارهای مجازی و چت‌بات‌های هوش مصنوعی اکنون می‌توانند میلیون‌ها کلمه اطلاعات را به‌صورت آنی پردازش کنند و درعین‌حال، پاسخگویی و سرعت خود را در تعامل با کاربر حفظ کنند.

انویدیا از یک تکنیک موازی‌سازی به نام «هلیکس پاراللیسم» (Helix Parallelism) پرده برداشته است که به مدل‌های هوش مصنوعی اجازه می‌دهد تا حجم عظیمی از اطلاعات را پردازش کنند و با همان سرعت به‌طور همزمان به ۳۲ برابر کاربر بیشتر پاسخ دهند. این فناوری به‌طور ویژه برای معماری پردازشگر‌های گرافیکی جدید بلک‌ول (Blackwell) طراحی شده است.

با بزرگ‌تر و پیچیده‌تر شدن مدل‌های هوش مصنوعی، یکی از مهم‌ترین مسائل آنها توانایی پردازش حجم عظیمی از اطلاعات زمینه (Context) در هنگام تولید پاسخ‌های آنی است. اکنون انویدیا با معرفی Helix Parallelism راه‌حلی برای این مشکل ارائه کرده است.

معرفی فناوری Helix انویدیا

مدل‌های زبان بزرگ برای تولید هر کلمه جدید، با دو چالش اساسی روبه‌رو هستند:

  1. آنها باید به‌طور مداوم کل تاریخچه مکالمه (که در حافظه‌ای به نام KV Cache ذخیره شده) را اسکن کنند که این فرایند پهنای باند حافظه پردازشگر گرافیکی (GPU) را به شدت تحت فشار قرار می‌دهد.
  2. همزمان، برای پردازش هر کلمه، باید وزن‌های عظیم «شبکه عصبی پیشخور» (FFN) از حافظه بارگذاری شوند که این امر باعث کندی و افزایش تأخیر، به‌ویژه در کاربردهای آنی و زنده مانند چت‌بات‌ها می‌شود.
Helix انویدیا

فناوری هلیکس با یک رویکرد هوشمندانه، این دو فرایند را از هم جدا و به صورت بهینه مدیریت می‌کند:

  • موازی‌سازی KV: در مرحله اول، هلیکس به‌جای کپی‌کردن کل حافظه مکالمه (KV Cache) روی تمام GPUها، آن را به صورت هوشمندانه بین پردازنده‌های مختلف تقسیم می‌کند. این کار از تکرار بیهوده داده‌ها جلوگیری می‌کند و فشار روی حافظه را به شدت کاهش می‌دهد.
  • استفاده مجدد از منابع: در مرحله بعد، همان GPUها بلافاصله وظیفه خود را تغییر می‌دهند و با استفاده از روش «موازی‌سازی تنسوری» (TP) به پردازش لایه FFN می‌پردازند. این جابه‌جایی هوشمندانه باعث می‌شود پردازنده‌ها همیشه فعال باقی بمانند و زمان بیکاری به حداقل برسد.

این فرایند پیچیده با استفاده از فناوری‌های اتصال پرسرعت انویدیا مانند NVLink و NVL72 و همچنین تکنیکی به نام HOP-B ممکن شده است.

نتایج شبیه‌سازی‌ها با یک مدل زبانی بزرگ، عملکرد فوق‌العاده این فناوری را به اثبات رسانده است؛ هلیکس می‌تواند با حفظ همان سرعت و تأخیر، به ۳۲ برابر کاربر بیشتر به‌صورت همزمان سرویس‌ بدهد. همچنین در شرایط بار کاری کمتر، زمان پاسخگویی (تأخیر بین تولید هر کلمه) تا ۱.۵ برابر کاهش می‌یابد.

این پیشرفت به این معناست که دستیارهای مجازی و چت‌بات‌های هوش مصنوعی اکنون می‌توانند میلیون‌ها کلمه اطلاعات را به‌صورت آنی پردازش کنند و درعین‌حال، پاسخگویی و سرعت خود را در تعامل با کاربر حفظ کنند.

اخبارجدیدترین

هوشمندترین هوش مصنوعی جهان؛ ایلان ماسک از Grok 4 رونمایی کرد

OpenAI چهار مهندس ارشد از شرکت‌های متا، تسلا و xAI استخدام کرد

مایکروسافت با استفاده از هوش مصنوعی و اخراج کارمندان ۵۰۰ میلیون دلار صرفه‌جویی کرده است

انویدیا از یک تکنیک موازی‌سازی به نام «هلیکس پاراللیسم» (Helix Parallelism) پرده برداشته است که به مدل‌های هوش مصنوعی اجازه می‌دهد تا حجم عظیمی از اطلاعات را پردازش کنند و با همان سرعت به‌طور همزمان به ۳۲ برابر کاربر بیشتر پاسخ دهند. این فناوری به‌طور ویژه برای معماری پردازشگر‌های گرافیکی جدید بلک‌ول (Blackwell) طراحی شده است.

با بزرگ‌تر و پیچیده‌تر شدن مدل‌های هوش مصنوعی، یکی از مهم‌ترین مسائل آنها توانایی پردازش حجم عظیمی از اطلاعات زمینه (Context) در هنگام تولید پاسخ‌های آنی است. اکنون انویدیا با معرفی Helix Parallelism راه‌حلی برای این مشکل ارائه کرده است.

معرفی فناوری Helix انویدیا

مدل‌های زبان بزرگ برای تولید هر کلمه جدید، با دو چالش اساسی روبه‌رو هستند:

  1. آنها باید به‌طور مداوم کل تاریخچه مکالمه (که در حافظه‌ای به نام KV Cache ذخیره شده) را اسکن کنند که این فرایند پهنای باند حافظه پردازشگر گرافیکی (GPU) را به شدت تحت فشار قرار می‌دهد.
  2. همزمان، برای پردازش هر کلمه، باید وزن‌های عظیم «شبکه عصبی پیشخور» (FFN) از حافظه بارگذاری شوند که این امر باعث کندی و افزایش تأخیر، به‌ویژه در کاربردهای آنی و زنده مانند چت‌بات‌ها می‌شود.
Helix انویدیا

فناوری هلیکس با یک رویکرد هوشمندانه، این دو فرایند را از هم جدا و به صورت بهینه مدیریت می‌کند:

  • موازی‌سازی KV: در مرحله اول، هلیکس به‌جای کپی‌کردن کل حافظه مکالمه (KV Cache) روی تمام GPUها، آن را به صورت هوشمندانه بین پردازنده‌های مختلف تقسیم می‌کند. این کار از تکرار بیهوده داده‌ها جلوگیری می‌کند و فشار روی حافظه را به شدت کاهش می‌دهد.
  • استفاده مجدد از منابع: در مرحله بعد، همان GPUها بلافاصله وظیفه خود را تغییر می‌دهند و با استفاده از روش «موازی‌سازی تنسوری» (TP) به پردازش لایه FFN می‌پردازند. این جابه‌جایی هوشمندانه باعث می‌شود پردازنده‌ها همیشه فعال باقی بمانند و زمان بیکاری به حداقل برسد.

این فرایند پیچیده با استفاده از فناوری‌های اتصال پرسرعت انویدیا مانند NVLink و NVL72 و همچنین تکنیکی به نام HOP-B ممکن شده است.

نتایج شبیه‌سازی‌ها با یک مدل زبانی بزرگ، عملکرد فوق‌العاده این فناوری را به اثبات رسانده است؛ هلیکس می‌تواند با حفظ همان سرعت و تأخیر، به ۳۲ برابر کاربر بیشتر به‌صورت همزمان سرویس‌ بدهد. همچنین در شرایط بار کاری کمتر، زمان پاسخگویی (تأخیر بین تولید هر کلمه) تا ۱.۵ برابر کاهش می‌یابد.

این پیشرفت به این معناست که دستیارهای مجازی و چت‌بات‌های هوش مصنوعی اکنون می‌توانند میلیون‌ها کلمه اطلاعات را به‌صورت آنی پردازش کنند و درعین‌حال، پاسخگویی و سرعت خود را در تعامل با کاربر حفظ کنند.

انویدیا از یک تکنیک موازی‌سازی به نام «هلیکس پاراللیسم» (Helix Parallelism) پرده برداشته است که به مدل‌های هوش مصنوعی اجازه می‌دهد تا حجم عظیمی از اطلاعات را پردازش کنند و با همان سرعت به‌طور همزمان به ۳۲ برابر کاربر بیشتر پاسخ دهند. این فناوری به‌طور ویژه برای معماری پردازشگر‌های گرافیکی جدید بلک‌ول (Blackwell) طراحی شده است.

با بزرگ‌تر و پیچیده‌تر شدن مدل‌های هوش مصنوعی، یکی از مهم‌ترین مسائل آنها توانایی پردازش حجم عظیمی از اطلاعات زمینه (Context) در هنگام تولید پاسخ‌های آنی است. اکنون انویدیا با معرفی Helix Parallelism راه‌حلی برای این مشکل ارائه کرده است.

معرفی فناوری Helix انویدیا

مدل‌های زبان بزرگ برای تولید هر کلمه جدید، با دو چالش اساسی روبه‌رو هستند:

  1. آنها باید به‌طور مداوم کل تاریخچه مکالمه (که در حافظه‌ای به نام KV Cache ذخیره شده) را اسکن کنند که این فرایند پهنای باند حافظه پردازشگر گرافیکی (GPU) را به شدت تحت فشار قرار می‌دهد.
  2. همزمان، برای پردازش هر کلمه، باید وزن‌های عظیم «شبکه عصبی پیشخور» (FFN) از حافظه بارگذاری شوند که این امر باعث کندی و افزایش تأخیر، به‌ویژه در کاربردهای آنی و زنده مانند چت‌بات‌ها می‌شود.
Helix انویدیا

فناوری هلیکس با یک رویکرد هوشمندانه، این دو فرایند را از هم جدا و به صورت بهینه مدیریت می‌کند:

  • موازی‌سازی KV: در مرحله اول، هلیکس به‌جای کپی‌کردن کل حافظه مکالمه (KV Cache) روی تمام GPUها، آن را به صورت هوشمندانه بین پردازنده‌های مختلف تقسیم می‌کند. این کار از تکرار بیهوده داده‌ها جلوگیری می‌کند و فشار روی حافظه را به شدت کاهش می‌دهد.
  • استفاده مجدد از منابع: در مرحله بعد، همان GPUها بلافاصله وظیفه خود را تغییر می‌دهند و با استفاده از روش «موازی‌سازی تنسوری» (TP) به پردازش لایه FFN می‌پردازند. این جابه‌جایی هوشمندانه باعث می‌شود پردازنده‌ها همیشه فعال باقی بمانند و زمان بیکاری به حداقل برسد.

این فرایند پیچیده با استفاده از فناوری‌های اتصال پرسرعت انویدیا مانند NVLink و NVL72 و همچنین تکنیکی به نام HOP-B ممکن شده است.

نتایج شبیه‌سازی‌ها با یک مدل زبانی بزرگ، عملکرد فوق‌العاده این فناوری را به اثبات رسانده است؛ هلیکس می‌تواند با حفظ همان سرعت و تأخیر، به ۳۲ برابر کاربر بیشتر به‌صورت همزمان سرویس‌ بدهد. همچنین در شرایط بار کاری کمتر، زمان پاسخگویی (تأخیر بین تولید هر کلمه) تا ۱.۵ برابر کاهش می‌یابد.

این پیشرفت به این معناست که دستیارهای مجازی و چت‌بات‌های هوش مصنوعی اکنون می‌توانند میلیون‌ها کلمه اطلاعات را به‌صورت آنی پردازش کنند و درعین‌حال، پاسخگویی و سرعت خود را در تعامل با کاربر حفظ کنند.

پست قبلی

قیمت طلا به جوش و خروش افتاد (۱۹ تیر۱۴۰۴ )

پست بعدی

توپ طلای ۲۰۲۵ به دمبله می‌رسد؟

مربوطه پست ها

هوشمندترین هوش مصنوعی جهان؛ ایلان ماسک از Grok 4 رونمایی کرد
هوش مصنوعی

هوشمندترین هوش مصنوعی جهان؛ ایلان ماسک از Grok 4 رونمایی کرد

۲۰ تیر ۱۴۰۴
OpenAI چهار مهندس ارشد از شرکت‌های متا، تسلا و xAI استخدام کرد
هوش مصنوعی

OpenAI چهار مهندس ارشد از شرکت‌های متا، تسلا و xAI استخدام کرد

۲۰ تیر ۱۴۰۴
مایکروسافت با استفاده از هوش مصنوعی و اخراج کارمندان ۵۰۰ میلیون دلار صرفه‌جویی کرده است
هوش مصنوعی

مایکروسافت با استفاده از هوش مصنوعی و اخراج کارمندان ۵۰۰ میلیون دلار صرفه‌جویی کرده است

۲۰ تیر ۱۴۰۴
محققان چینی از MemOS رونمایی کردند؛ اولین «سیستم‌عامل حافظه» برای هوش مصنوعی
هوش مصنوعی

محققان چینی از MemOS رونمایی کردند؛ اولین «سیستم‌عامل حافظه» برای هوش مصنوعی

۱۹ تیر ۱۴۰۴
تقلید صدای وزیر امور خارجه آمریکا با هوش مصنوعی؛ کمپینی برای فریب مقامات سیاسی
هوش مصنوعی

تقلید صدای وزیر امور خارجه آمریکا با هوش مصنوعی؛ کمپینی برای فریب مقامات سیاسی

۱۸ تیر ۱۴۰۴
مایکروسافت، OpenAI و آنتروپیک در آموزش هوش مصنوعی به معلمان آمریکایی کمک می‌کنند
هوش مصنوعی

مایکروسافت، OpenAI و آنتروپیک در آموزش هوش مصنوعی به معلمان آمریکایی کمک می‌کنند

۱۸ تیر ۱۴۰۴

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

5 + هفت =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • از انقراض تا احیا؛ مستندی که سرگذشت گورخر ایرانی را روایت می‌کند
  • نگاهی به تبلیغات مجازی؛ تئاتر ایران در دوراهی جذب یا فریب مخاطب است؟!
  • آیین یادبود شهدای رسانه ملی برگزار می‌شود
  • پرونده ویژه درباره «غرور ملی» در «هفت»؛ «صددام» نقد می‌شود
  • تاثیر انفجار بر استودیو انیمیشن‌سازی؛ شیشه‌ها فرو ریخت اما کار ترک نشد
  • پاسینیک
  • خرید سرور hp
  • خرید سرور ایران و خارج
  • مانیتور ساینا کوییک
  • خرید یوسی
  • حوله استخری
  • خرید قهوه
  • تجارتخانه آراد برندینگ
  • ویرایش مقاله
  • تابلو لایت باکس
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • قیمت هاست فروشگاهی
  • پرشین هتل
  • خرید لیفتراک دست دوم
  • آموزش علوم اول ابتدایی
  • راحت ترین روش یادگیری انگلیسی

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.