پنجشنبه, مرداد ۳۰, ۱۴۰۴
دانش جوین
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
بدون نتیجه
مشاهده همه نتیجه
  • ورود
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی هوش مصنوعی

مدل هوش مصنوعی دیپ‌سیک V3.1 با پنجره محتوایی بزرگ‌تر منتشر شد

دیجیاتو توسط دیجیاتو
۳۰ مرداد ۱۴۰۴
در هوش مصنوعی
زمان خواندن: زمان موردنیاز برای مطالعه: 2 دقیقه
0
A A
مدل هوش مصنوعی دیپ‌سیک V3.1 با پنجره محتوایی بزرگ‌تر منتشر شد
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

شرکت چینی دیپ‌سیک نسخه 3.1 مدل بزرگ زبانی خود را معرفی کرد که با افزایش طول پنجره متنی تا 128 هزارتوکن و افزایش تعداد پارامترها به 685 میلیارد، توانایی پردازش و عملکرد مدل را به‌شکل قابل توجهی بهبود داده است.

تغییرات نسخه 3.1 دیپ‌سیک

براساس گزارش‌ها ویژگی متمایز دیپ‌سیک V3.1، توانایی مدیریت متن‌های طولانی است؛ این مدل اکنون قادر است اطلاعات معادل یک کتاب 300 تا 400 صفحه‌ای را پردازش کند. این قابلیت باعث بهبود عملکرد در تولید محتوای طولانی، تحلیل اسناد و انجام مکالمات چندمرحله‌ای می‌شود. شرکت اعلام کرده که این امکان پیش‌تر در نسخه داخلی V3 وجود داشت، اما اکنون در تمامی رابط‌ها به‌طور رسمی فعال شده است.

ویژگی‌های نسخه 3.1 دیپ‌سیک

DeepSeek 3.1 همچنان بر پایه معماری Mixture-of-Experts (MoE) ساخته شده است و فقط 37 میلیارد پارامتر در هر توکن فعال می‌شود. این مدل از فرمت‌های مختلف دقت شامل BF16 ،FP8 و F32 پشتیبانی می‌کند تا در محیط‌های متنوع انعطاف‌پذیری بیشتری داشته باشد. توسعه‌دهندگان می‌توانند از طریق API یا از طریق Hugging Face به این مدل دسترسی پیدا کنند.

در ارزیابی‌های اولیه، دیپ‌سیک V3.1 با کسب امتیاز 71.6 درصد در آزمون کدنویسی Aider، عملکردی بالاتر از Claude Opus 4 داشت و به یکی از قوی‌ترین مدل‌های متن‌باز برای برنامه‌نویسی تبدیل شد. این مدل همچنین در حل مسائل ریاضی و منطقی پیشرفت چشمگیری نشان داد، اگرچه برخی کاربران تغییر قابل توجهی در توانایی استدلال آن نسبت به مدل R1-0528 قبلی مشاهده نکردند.

شرکت دیپ‌سیک تمامی ارجاعات به مدل R1 را از رابط چت‌بات حذف کرده و به سمت معماری هیبریدی پیش رفته است. قابلیت‌های استدلال اکنون در V3.1 ادغام شده‌اند و دیگر نیازی به مدل جداگانه نیست. هزینه آموزش این نسخه هنوز مشخص نشده، اما نسخه اصلی V3 با استفاده از 2.788 میلیون ساعت GPU روی تراشه‌های انویدیا H800 و با هزینه تقریبی 5.6 میلیون دلار آموزش داده شده بود که پایه‌ای برای نسخه جدید به‌شمار می‌رود.

در شرایطی که انتظار می‌رفت مدل بعدی R2 با تمرکز بر بهبود توانایی‌های استدلال منتشر شود، دیپ‌سیک حالا نسخه V3.1 را منتشر کرده است. گزارش‌ها نشان می‌دهد که مشکلات فنی تراشه‌های Huawei Ascend موجب تأخیر در عرضه R2 شده است. ظاهراً آموزش مدل روی تراشه‌های Ascend به‌دلیل ناسازگاری‌ها موفقیت‌آمیز نبوده و شرکت مجبور شده از پردازشگرهای گرافیکی انویدیا برای آموزش استفاده کند و Ascend را تنها برای استنتاج نگه دارد. این رویکرد ترکیبی باعث پیچیدگی و کندی روند توسعه شده و عرضه را به تعویق انداخته است.

تا زمان عرضه مدل دیپ‌سیک R2، نسخه V3.1 به‌عنوان پرچمدار فعلی دیپ‌سیک باقی می‌ماند و قادر است هم وظایف استدلالی و هم غیراستدلالی را در یک چارچوب یکپارچه اجرا و مدیریت کند.

شاید برای شما جالب باشد

انویدیا تراشه‌های هوش مصنوعی قوی‌تر از H20 برای بازار چین می‌سازد

رقیبی برای فتوشاپ؛ هوش مصنوعی جدید علی‌بابا ویرایش دقیق تصاویر را ساده می‌کند

رئیس هیئت‌مدیره OpenAI می‌گوید بسیاری از پروژه‌های فعلی هوش مصنوعی بی‌ارزش هستند

شرکت چینی دیپ‌سیک نسخه 3.1 مدل بزرگ زبانی خود را معرفی کرد که با افزایش طول پنجره متنی تا 128 هزارتوکن و افزایش تعداد پارامترها به 685 میلیارد، توانایی پردازش و عملکرد مدل را به‌شکل قابل توجهی بهبود داده است.

تغییرات نسخه 3.1 دیپ‌سیک

براساس گزارش‌ها ویژگی متمایز دیپ‌سیک V3.1، توانایی مدیریت متن‌های طولانی است؛ این مدل اکنون قادر است اطلاعات معادل یک کتاب 300 تا 400 صفحه‌ای را پردازش کند. این قابلیت باعث بهبود عملکرد در تولید محتوای طولانی، تحلیل اسناد و انجام مکالمات چندمرحله‌ای می‌شود. شرکت اعلام کرده که این امکان پیش‌تر در نسخه داخلی V3 وجود داشت، اما اکنون در تمامی رابط‌ها به‌طور رسمی فعال شده است.

ویژگی‌های نسخه 3.1 دیپ‌سیک

DeepSeek 3.1 همچنان بر پایه معماری Mixture-of-Experts (MoE) ساخته شده است و فقط 37 میلیارد پارامتر در هر توکن فعال می‌شود. این مدل از فرمت‌های مختلف دقت شامل BF16 ،FP8 و F32 پشتیبانی می‌کند تا در محیط‌های متنوع انعطاف‌پذیری بیشتری داشته باشد. توسعه‌دهندگان می‌توانند از طریق API یا از طریق Hugging Face به این مدل دسترسی پیدا کنند.

در ارزیابی‌های اولیه، دیپ‌سیک V3.1 با کسب امتیاز 71.6 درصد در آزمون کدنویسی Aider، عملکردی بالاتر از Claude Opus 4 داشت و به یکی از قوی‌ترین مدل‌های متن‌باز برای برنامه‌نویسی تبدیل شد. این مدل همچنین در حل مسائل ریاضی و منطقی پیشرفت چشمگیری نشان داد، اگرچه برخی کاربران تغییر قابل توجهی در توانایی استدلال آن نسبت به مدل R1-0528 قبلی مشاهده نکردند.

شرکت دیپ‌سیک تمامی ارجاعات به مدل R1 را از رابط چت‌بات حذف کرده و به سمت معماری هیبریدی پیش رفته است. قابلیت‌های استدلال اکنون در V3.1 ادغام شده‌اند و دیگر نیازی به مدل جداگانه نیست. هزینه آموزش این نسخه هنوز مشخص نشده، اما نسخه اصلی V3 با استفاده از 2.788 میلیون ساعت GPU روی تراشه‌های انویدیا H800 و با هزینه تقریبی 5.6 میلیون دلار آموزش داده شده بود که پایه‌ای برای نسخه جدید به‌شمار می‌رود.

در شرایطی که انتظار می‌رفت مدل بعدی R2 با تمرکز بر بهبود توانایی‌های استدلال منتشر شود، دیپ‌سیک حالا نسخه V3.1 را منتشر کرده است. گزارش‌ها نشان می‌دهد که مشکلات فنی تراشه‌های Huawei Ascend موجب تأخیر در عرضه R2 شده است. ظاهراً آموزش مدل روی تراشه‌های Ascend به‌دلیل ناسازگاری‌ها موفقیت‌آمیز نبوده و شرکت مجبور شده از پردازشگرهای گرافیکی انویدیا برای آموزش استفاده کند و Ascend را تنها برای استنتاج نگه دارد. این رویکرد ترکیبی باعث پیچیدگی و کندی روند توسعه شده و عرضه را به تعویق انداخته است.

تا زمان عرضه مدل دیپ‌سیک R2، نسخه V3.1 به‌عنوان پرچمدار فعلی دیپ‌سیک باقی می‌ماند و قادر است هم وظایف استدلالی و هم غیراستدلالی را در یک چارچوب یکپارچه اجرا و مدیریت کند.

پست قبلی

عرضه بیش از ۸۰ درصد محصولات فولاد مبارکه از طریق بورس کالا/ توسعه محصولات کیفی‌تر

پست بعدی

اسنپ: ترافیک و اختلال GPS عامل گرانی سفرهاست

پست بعدی

اسنپ: ترافیک و اختلال GPS عامل گرانی سفرهاست

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

5 × چهار =

چهار + شش =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • آغاز محدودیت‌های ترافیکی از فردا در جاده‌های شمال
  • ادارات لرستان چهارشنبه ۲۹ مرداد تعطیل شد
  • هر دو باند تونل توحید امشب مسدود می‌شود
  • المپیادی‌ها از «سربازی» معاف نیستند
  • گزارش یک خداحافظی موسیقایی؛ در کنسرت «نامیرا» چه گذشت؟
  • پاسینیک
  • خرید سرور ایران و خارج
  • تجارتخانه آراد برندینگ
  • ویرایش مقاله
  • تابلو لایت باکس
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • پرشین هتل
  • راحت ترین روش یادگیری انگلیسی
  • خرید سرور ابری
  • سنگ قبر
  • خرید کتاب زبا انگلیسی – قیمت کتاب زبان انگلیسی با تخفیف – کتاب آموزشی زبان انگلیسی

تمامی حقوق برای دانش جوین محفوظ بوده و کپی از آن پیگرد قانونی خواهد داشت

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده

تمامی حقوق برای دانش جوین محفوظ بوده و کپی از آن پیگرد قانونی خواهد داشت