چهارشنبه, مرداد ۲۹, ۱۴۰۴
دانش جوین
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
بدون نتیجه
مشاهده همه نتیجه
  • ورود
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی هوش مصنوعی

مدل جدید DeepSeek با بهبودهای چشمگیر به‌روز شد؛ چالشی تازه برای OpenAI o3 و جمینای 2.5 پرو

دیجیاتو توسط دیجیاتو
۱۷ خرداد ۱۴۰۴
در هوش مصنوعی
زمان خواندن: زمان موردنیاز برای مطالعه: 2 دقیقه
0
A A
مدل جدید DeepSeek با بهبودهای چشمگیر به‌روز شد؛ چالشی تازه برای OpenAI o3 و جمینای 2.5 پرو
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

شرکت چینی DeepSeek که با عرضه نسخه اولیه مدل استدلالی R1 توانسته بود سروصدای زیادی بکند، از مدل‌ متن‌باز جدیدی با عنوان DeepSeek-R1-0528 رونمایی کرده که قابلیت‌های آن در استدلال به اندازه زیادی ارتقا یافته است. از نظر عملکرد، این مدل به o3 از OpenAI و گوگل جمینای 2.5 پرو نزدیک‌تر شده است.

طبق اطلاعات منتشر شده درباره این مدل، عملکرد DeepSeek-R1-0528 در حوزه‌هایی مانند ریاضیات، علوم و برنامه‌نویسی به‌شکل محسوسی بهبود یافته است.

براساس اطلاعات مدل منتشرشده در پلتفرم هاگینگ‌فیس، DeepSeek-R1-0528 با استفاده از منابع محاسباتی بیشتر و بهینه‌سازی‌های الگوریتمی پس از آموزش، بهبودهای چشمگیری در عملکرد نشان داده است. به‌عنوان نمونه، دقت مدل در آزمون AIME 2025 از 70 به 87.5 درصد رسیده و در حوزه برنامه‌نویسی عملکرد مدل در بنچ‌مارک LiveCodeBench از 63.5 به 73.3 درصد افزایش یافته است. در آزمون دشوار Humanity’s Last Exam نیز دقت آن از 8.5 به 17.7 درصد رسیده است.

نسخه کوچک‌تر مدل جدید DeepSeek

هم‌زمان با نسخه اصلی، مدل کوچک‌تری با نام DeepSeek-R1-0528-Qwen3-8B نیز معرفی شده که برای اجرا در سخت‌افزارهای ضعیف‌تر مناسب است. عملکرد این مدل از Qwen3-8B بهتر بوده و با Qwen3-235B-thinking برابری می‌کند. اجرای این مدل 8 میلیارد پارامتری در حالت FP16 حداقل به 16 گیگابایت حافظه گرافیکی نیاز دارد.

مانند نسخه قبلی، این مدل متن‌باز و تحت مجوز MIT منتشر شده و برای استفاده تجاری نیز دردسترس است. نسخه کامل مدل در پلتفرم Hugging Face بارگذاری شده و مستندات کامل آن نیز از گیت‌هاب و API اختصاصی DeepSeek در دسترس توسعه‌دهندگان قرار گرفته است. کاربران API دیپ‌سیک نیز خودکار به این نسخه ارتقا پیدا می‌کنند.

کاربران در شبکه‌های اجتماعی انتشار این نسخه با استقبال است. کاربری با نام Haider در ایکس، عملکرد مدل را در برنامه‌نویسی فوق‌العاده توصیف کرده و آن را تنها رقیب جدی o3 دانسته است. کاربر دیگری با نام Lisan al Gaib نیز DeepSeek را رقیب مستقیم o3 و Gemini معرفی کرده است.

شاید برای شما جالب باشد

OpenAI از اشتراک ارزان‌قیمت ChatGPT Go رونمایی کرد؛ ماهی ۴.۶ دلار

دنیای اسباب‌بازی‌ها تغییر می‌کند؛ عرضه عروسک‌های مجهز به هوش مصنوعی

هوش مصنوعی Claude اکنون می‌تواند به مکالمات آزاردهنده پایان دهد

شرکت چینی DeepSeek که با عرضه نسخه اولیه مدل استدلالی R1 توانسته بود سروصدای زیادی بکند، از مدل‌ متن‌باز جدیدی با عنوان DeepSeek-R1-0528 رونمایی کرده که قابلیت‌های آن در استدلال به اندازه زیادی ارتقا یافته است. از نظر عملکرد، این مدل به o3 از OpenAI و گوگل جمینای 2.5 پرو نزدیک‌تر شده است.

طبق اطلاعات منتشر شده درباره این مدل، عملکرد DeepSeek-R1-0528 در حوزه‌هایی مانند ریاضیات، علوم و برنامه‌نویسی به‌شکل محسوسی بهبود یافته است.

براساس اطلاعات مدل منتشرشده در پلتفرم هاگینگ‌فیس، DeepSeek-R1-0528 با استفاده از منابع محاسباتی بیشتر و بهینه‌سازی‌های الگوریتمی پس از آموزش، بهبودهای چشمگیری در عملکرد نشان داده است. به‌عنوان نمونه، دقت مدل در آزمون AIME 2025 از 70 به 87.5 درصد رسیده و در حوزه برنامه‌نویسی عملکرد مدل در بنچ‌مارک LiveCodeBench از 63.5 به 73.3 درصد افزایش یافته است. در آزمون دشوار Humanity’s Last Exam نیز دقت آن از 8.5 به 17.7 درصد رسیده است.

نسخه کوچک‌تر مدل جدید DeepSeek

هم‌زمان با نسخه اصلی، مدل کوچک‌تری با نام DeepSeek-R1-0528-Qwen3-8B نیز معرفی شده که برای اجرا در سخت‌افزارهای ضعیف‌تر مناسب است. عملکرد این مدل از Qwen3-8B بهتر بوده و با Qwen3-235B-thinking برابری می‌کند. اجرای این مدل 8 میلیارد پارامتری در حالت FP16 حداقل به 16 گیگابایت حافظه گرافیکی نیاز دارد.

مانند نسخه قبلی، این مدل متن‌باز و تحت مجوز MIT منتشر شده و برای استفاده تجاری نیز دردسترس است. نسخه کامل مدل در پلتفرم Hugging Face بارگذاری شده و مستندات کامل آن نیز از گیت‌هاب و API اختصاصی DeepSeek در دسترس توسعه‌دهندگان قرار گرفته است. کاربران API دیپ‌سیک نیز خودکار به این نسخه ارتقا پیدا می‌کنند.

کاربران در شبکه‌های اجتماعی انتشار این نسخه با استقبال است. کاربری با نام Haider در ایکس، عملکرد مدل را در برنامه‌نویسی فوق‌العاده توصیف کرده و آن را تنها رقیب جدی o3 دانسته است. کاربر دیگری با نام Lisan al Gaib نیز DeepSeek را رقیب مستقیم o3 و Gemini معرفی کرده است.

پست قبلی

برنده اصلی دعوای ایلان ماسک و ترامپ

پست بعدی

سکوی ملی هوش مصنوعی با حمایت ۳۰ میلیاردی در راه آزمایش

پست بعدی
سکوی ملی هوش مصنوعی با حمایت ۳۰ میلیاردی در راه آزمایش

سکوی ملی هوش مصنوعی با حمایت ۳۰ میلیاردی در راه آزمایش

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

یازده + هفت =

هفت + نوزده =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • برترین پزشکان جهان در آلمان
  • تشییع و خاکسپاری پیکر استاد «محمود فرشچیان» در اصفهان
  • ۳پرده از سیدمجتبی؛دستخوش یک‌قرانی«نواب»که مسعود کیمیایی را سینمایی کرد
  • انتقاد یک تئاتری از بی‌ثباتی مدیریت؛ احساس می‌کنم رها شده‌ام!
  • از انتشار یک آلبوم با حضور ۲ برادر شناخته‌شده تا «بانگ عشق» یک آهنگساز
  • پاسینیک
  • خرید سرور ایران و خارج
  • تجارتخانه آراد برندینگ
  • ویرایش مقاله
  • تابلو لایت باکس
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • پرشین هتل
  • راحت ترین روش یادگیری انگلیسی
  • خرید سرور ابری
  • سنگ قبر
  • خرید کتاب زبا انگلیسی – قیمت کتاب زبان انگلیسی با تخفیف – کتاب آموزشی زبان انگلیسی

تمامی حقوق برای دانش جوین محفوظ بوده و کپی از آن پیگرد قانونی خواهد داشت

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده

تمامی حقوق برای دانش جوین محفوظ بوده و کپی از آن پیگرد قانونی خواهد داشت