دانش جوین
دوشنبه, تیر ۳۰, ۱۴۰۴
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
  • ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی هوش مصنوعی

هوش مصنوعی DeepSeek چیست؟ معرفی رقیب قدرتمند و رایگان ChatGPT

دیجیاتو توسط دیجیاتو
۰۸ بهمن ۱۴۰۳
در هوش مصنوعی
زمان خواندن: زمان موردنیاز برای مطالعه: 8 دقیقه
1
هوش مصنوعی DeepSeek چیست؟ معرفی رقیب قدرتمند و رایگان ChatGPT
8
بازدیدها
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

DeepSeek AI استارتاپ چینی درحال‌رشدی است که به‌دلیل پیشرفت‌های خود در زمینه هوش مصنوعی موردتوجه جهان قرار گرفته است. شرکت چینی به عقیده بسیاری از کارشناسان یکی از قدرتمندترین مدل‌های هوش مصنوعی رایگان با نام دیپ‌سیک را منتشر کرده است که در ادامه این مطلب آن را معرفی خواهیم کرد.

هوش مصنوعی دیپ‌سیک چیست؟

جدیدترین نسخه از مدل هوش مصنوعی این شرکت که DeepSeek V3 نام دارد، اواخر 2024 منتشر شد و توسعه‌دهندگان می‌توانند شخصی‌سازی‌شده آن را دانلود و در برنامه‌های خود استفاده کنند. همان‌طور که اشاره کردیم، مدل‌های دیپ‌سیک کاملاً متن‌باز هستند؛ توسعه‌دهندگان می‌توانند آنها را دانلود کنند و برای استفاده در برنامه‌ها و پروژه‌های خود تغییر دهند.

این مدل هوش مصنوعی از معماری نوآورانه‌ای بهره می‌برد که در ادامه به آن می‌پردازیم. همین معماری باعث شده در مقایسه با بسیاری از مدل‌های هوش مصنوعی قدرتمند امروزی از شرکت‌هایی مانند متا و OpenAI که برای استفاه از امکانات پیشرفته آنها باید پول بپردازید، قدرتمندتر باشد.

قابلیت‌های هوش مصنوعی DeepSeek V3 و برتری آن نسبت به رقبا

دیپ سیک می‌گوید که مدل پرچم‌دار آن می‌تواند طیف وسیعی از وظایف و کارهای مبتنی‌بر متن، نظیر کدنویسی، ترجمه و نگارش مقاله و ایمیل را انجام دهد. همچنین در آموزش آن از پردازشگرهای گرافیکی H800 مخصوص چین از شرکت انویدیا استفاده شده است.

دیپ سیک با تست‌های خود اعلام کرده DeepSeek V3 هم از مدل‌های قابل‌دانلود و رایگان هم از مدل‌های غیررایگان که فقط از طریق API در دسترس هستند، بهتر عمل می‌کند. به گفته این شرکت و طبق تصویر زیر مدل هوش مصنوعی آن در کدنویسی از مدل‌های دیگر مانند Llama 3.1 متعلق به متا، GPT-4o از OpenAI و Qwen 2.5 72B شرکت چینی Alibaba بهتر عمل کرده است.

دیپ سیک ادعا کرده DeepSeek V3 با مجموعه داده‌ای از 14 تریلیون و 800 میلیارد توکن آموزش دیده است. برای درک بهتر این موضوع باید گفت هر یک‌میلیون توکن معادل حدود 750 هزار کلمه است. DeepSeek V3 از نظر اندازه نیز بسیار وسیع است و از 671 میلیارد پارامتر پشتیبانی می‌کند (پارامترها متغیرهای داخلی هستند که مدل‌های برای پیش‌بینی یا تصمیم‌گیری از آنها استفاده می‌کنند). با این شرایط، هوش مصنوعی این شرکت تقریباً 1.6 برابر از Llama 3.1 405B شرکت متا بزرگ‌تر است که از 405 میلیارد پارامتر پشتیبانی می‌کند.

نکته جالب دیگر اینکه چینی‌ها مدل پرچم‌دار خود را فقط در 2 ماه و با هزینه‌ای نزدیک به 5.58 میلیون دلار آموزش داده‌اند؛ بنابراین در مقایسه با شرکت‌های بزرگی مانند متا و OpenAI این شرکت زمان و منابع کمتری برای مدل هوش مصنوعی خود صرف کرده است.

معماری نوآورانه DeepSeek V3

دیپ سیک برای توسعه مدل خود از معماری بهینه‌شده‌ای (با نام ترکیبی-از-متخصصان یا MoE) استفاده کرده است که نیاز آن به قدرت محاسباتی گسترده و سخت‎‌افزارهای قدرتمند را کاهش می‌دهد. این معماری را تیم (متخصص) از سیستم‌های هوش مصنوعی تخصصی در نظر بگیرید که در آن هر به‌اصطلاح «متخصص» شبکه عصبی خود را دارد و برای انجام وظایف مرتبط با خود فعال می‌شوند.

در واقع این معماری پیش از انجام وظایف، پیچیدگی آنها را پیش‌بینی می‌کند و براساس منابعی که در اختیار دارد، (متخصصان) مسیر موردنیاز برای تحقق آن را تعیین می‌کند. همچنین برای انجام هریک از وظایف فقط مرتبط‌‌ترین سیستم‌های هوش مصنوعی فعال خواهند شد که این امر محاسبات اضافی را به حداقل می‌رساند و سرعت عملکرد مدل را بیشتر می‌کند.

آزمایش هوش مصنوعی دیپ سیک

برای آزمایش نحوه عملکرد هوش مصنوعی DeepSeek نیز در ادامه به چند مثال اشاره کرده‌ایم. در اولین مورد، از این مدل خواسته‌شده شرح مفصلی از شخصیتی فانتزی (ملکه‌ای که مقابل امپراتوری شیطانی مقاومت می‌کند) بنویسد. سپس DeepSeek V3 با انتخاب نام، عنوان، سن و ظاهر این شخصیت داستانی فانتزی نوشته است:

برای آزمایش مهارت این مدل در کدنویسی نیز طبق مثال زیر کد جاوا اسکریپت معیوب به آن داده شده است. همان‌طور که در تصویر زیر مشاهده می‌کنید، دیپ‌سیک بلافاصله مشکل را متوجه شده و ضمن توضیح آن، کد اصلاح‌شده را برای کاربر ارسال کرده است:

در مثال زیر، توانایی DeepSeek V3 در بهره‌وری آزمایش شده است. در آن کاربر از هوش مصنوعی خواسته دستور کار مختصری برای جلسه‌ای درباره راه‌اندازی محصولی جدید تهیه کند. سپس هوش مصنوعی فهرست موضوعات پیشنهادی خود را که می‌توان در جلسه مطرح کرد، همراه مدت برنامه‌ریزی‌شده برای آنها به کاربر ارائه کرده است:

درکل،‎ درباره عملکرد این مدل گفته شده DeepSeek طیف گسترده‌ای از وظایف مانند نوشتن و رفع مشکلات کدهای پیچیده را به‌راحتی انجام می‌دهد. همچنین این مدل می‌تواند لحن و سبک نوشته‌های خود را براساس موضوعات مختلف تنظیم کند اما DeepSeek هم مانند بسیاری از مدل‌های هوش مصنوعی دیگر در پاسخ‌ به موضوعات بسیار خاص ممکن است اطلاعات اشتباه ارائه کند. همچنین ظاهراً DeepSeek V3 تمایلی به ارائه پاسخ درباره موضوعات تاریخی حساس ندارد.

دسترسی به هوش مصنوعی DeepSeek V3

هم‌اکنون رایگان می‌توانید از نسخه وب هوش مصنوعی پرچم‌دار چینی DeepSeek V3 استفاده کنید. البته برای استفاده از آن به حساب کاربری نیاز دارید که از طریق حساب گوگل نیز می‌توان آن را ایجاد کرد. محیط کاربری این سرویس شباهت زیادی به ChatGPT دارد و می‌توانید پس از ورود به حساب خود با آن گفتگو کنید. نکته قابل‌توجه اینکه این مدل از زبان فارسی نیز پشتیبانی می‌کند و کاربران ایرانی را تحریم نکرده است.

افزون‌بر نسخه وب، درحال‌حاضر اپلیکیشن DeepSeek برای اندروید و iOS نیز موجود است.

DeepSeek AI استارتاپ چینی درحال‌رشدی است که به‌دلیل پیشرفت‌های خود در زمینه هوش مصنوعی موردتوجه جهان قرار گرفته است. شرکت چینی به عقیده بسیاری از کارشناسان یکی از قدرتمندترین مدل‌های هوش مصنوعی رایگان با نام دیپ‌سیک را منتشر کرده است که در ادامه این مطلب آن را معرفی خواهیم کرد.

هوش مصنوعی دیپ‌سیک چیست؟

جدیدترین نسخه از مدل هوش مصنوعی این شرکت که DeepSeek V3 نام دارد، اواخر 2024 منتشر شد و توسعه‌دهندگان می‌توانند شخصی‌سازی‌شده آن را دانلود و در برنامه‌های خود استفاده کنند. همان‌طور که اشاره کردیم، مدل‌های دیپ‌سیک کاملاً متن‌باز هستند؛ توسعه‌دهندگان می‌توانند آنها را دانلود کنند و برای استفاده در برنامه‌ها و پروژه‌های خود تغییر دهند.

این مدل هوش مصنوعی از معماری نوآورانه‌ای بهره می‌برد که در ادامه به آن می‌پردازیم. همین معماری باعث شده در مقایسه با بسیاری از مدل‌های هوش مصنوعی قدرتمند امروزی از شرکت‌هایی مانند متا و OpenAI که برای استفاه از امکانات پیشرفته آنها باید پول بپردازید، قدرتمندتر باشد.

قابلیت‌های هوش مصنوعی DeepSeek V3 و برتری آن نسبت به رقبا

دیپ سیک می‌گوید که مدل پرچم‌دار آن می‌تواند طیف وسیعی از وظایف و کارهای مبتنی‌بر متن، نظیر کدنویسی، ترجمه و نگارش مقاله و ایمیل را انجام دهد. همچنین در آموزش آن از پردازشگرهای گرافیکی H800 مخصوص چین از شرکت انویدیا استفاده شده است.

دیپ سیک با تست‌های خود اعلام کرده DeepSeek V3 هم از مدل‌های قابل‌دانلود و رایگان هم از مدل‌های غیررایگان که فقط از طریق API در دسترس هستند، بهتر عمل می‌کند. به گفته این شرکت و طبق تصویر زیر مدل هوش مصنوعی آن در کدنویسی از مدل‌های دیگر مانند Llama 3.1 متعلق به متا، GPT-4o از OpenAI و Qwen 2.5 72B شرکت چینی Alibaba بهتر عمل کرده است.

دیپ سیک ادعا کرده DeepSeek V3 با مجموعه داده‌ای از 14 تریلیون و 800 میلیارد توکن آموزش دیده است. برای درک بهتر این موضوع باید گفت هر یک‌میلیون توکن معادل حدود 750 هزار کلمه است. DeepSeek V3 از نظر اندازه نیز بسیار وسیع است و از 671 میلیارد پارامتر پشتیبانی می‌کند (پارامترها متغیرهای داخلی هستند که مدل‌های برای پیش‌بینی یا تصمیم‌گیری از آنها استفاده می‌کنند). با این شرایط، هوش مصنوعی این شرکت تقریباً 1.6 برابر از Llama 3.1 405B شرکت متا بزرگ‌تر است که از 405 میلیارد پارامتر پشتیبانی می‌کند.

نکته جالب دیگر اینکه چینی‌ها مدل پرچم‌دار خود را فقط در 2 ماه و با هزینه‌ای نزدیک به 5.58 میلیون دلار آموزش داده‌اند؛ بنابراین در مقایسه با شرکت‌های بزرگی مانند متا و OpenAI این شرکت زمان و منابع کمتری برای مدل هوش مصنوعی خود صرف کرده است.

معماری نوآورانه DeepSeek V3

دیپ سیک برای توسعه مدل خود از معماری بهینه‌شده‌ای (با نام ترکیبی-از-متخصصان یا MoE) استفاده کرده است که نیاز آن به قدرت محاسباتی گسترده و سخت‎‌افزارهای قدرتمند را کاهش می‌دهد. این معماری را تیم (متخصص) از سیستم‌های هوش مصنوعی تخصصی در نظر بگیرید که در آن هر به‌اصطلاح «متخصص» شبکه عصبی خود را دارد و برای انجام وظایف مرتبط با خود فعال می‌شوند.

در واقع این معماری پیش از انجام وظایف، پیچیدگی آنها را پیش‌بینی می‌کند و براساس منابعی که در اختیار دارد، (متخصصان) مسیر موردنیاز برای تحقق آن را تعیین می‌کند. همچنین برای انجام هریک از وظایف فقط مرتبط‌‌ترین سیستم‌های هوش مصنوعی فعال خواهند شد که این امر محاسبات اضافی را به حداقل می‌رساند و سرعت عملکرد مدل را بیشتر می‌کند.

آزمایش هوش مصنوعی دیپ سیک

برای آزمایش نحوه عملکرد هوش مصنوعی DeepSeek نیز در ادامه به چند مثال اشاره کرده‌ایم. در اولین مورد، از این مدل خواسته‌شده شرح مفصلی از شخصیتی فانتزی (ملکه‌ای که مقابل امپراتوری شیطانی مقاومت می‌کند) بنویسد. سپس DeepSeek V3 با انتخاب نام، عنوان، سن و ظاهر این شخصیت داستانی فانتزی نوشته است:

برای آزمایش مهارت این مدل در کدنویسی نیز طبق مثال زیر کد جاوا اسکریپت معیوب به آن داده شده است. همان‌طور که در تصویر زیر مشاهده می‌کنید، دیپ‌سیک بلافاصله مشکل را متوجه شده و ضمن توضیح آن، کد اصلاح‌شده را برای کاربر ارسال کرده است:

در مثال زیر، توانایی DeepSeek V3 در بهره‌وری آزمایش شده است. در آن کاربر از هوش مصنوعی خواسته دستور کار مختصری برای جلسه‌ای درباره راه‌اندازی محصولی جدید تهیه کند. سپس هوش مصنوعی فهرست موضوعات پیشنهادی خود را که می‌توان در جلسه مطرح کرد، همراه مدت برنامه‌ریزی‌شده برای آنها به کاربر ارائه کرده است:

درکل،‎ درباره عملکرد این مدل گفته شده DeepSeek طیف گسترده‌ای از وظایف مانند نوشتن و رفع مشکلات کدهای پیچیده را به‌راحتی انجام می‌دهد. همچنین این مدل می‌تواند لحن و سبک نوشته‌های خود را براساس موضوعات مختلف تنظیم کند اما DeepSeek هم مانند بسیاری از مدل‌های هوش مصنوعی دیگر در پاسخ‌ به موضوعات بسیار خاص ممکن است اطلاعات اشتباه ارائه کند. همچنین ظاهراً DeepSeek V3 تمایلی به ارائه پاسخ درباره موضوعات تاریخی حساس ندارد.

دسترسی به هوش مصنوعی DeepSeek V3

هم‌اکنون رایگان می‌توانید از نسخه وب هوش مصنوعی پرچم‌دار چینی DeepSeek V3 استفاده کنید. البته برای استفاده از آن به حساب کاربری نیاز دارید که از طریق حساب گوگل نیز می‌توان آن را ایجاد کرد. محیط کاربری این سرویس شباهت زیادی به ChatGPT دارد و می‌توانید پس از ورود به حساب خود با آن گفتگو کنید. نکته قابل‌توجه اینکه این مدل از زبان فارسی نیز پشتیبانی می‌کند و کاربران ایرانی را تحریم نکرده است.

افزون‌بر نسخه وب، درحال‌حاضر اپلیکیشن DeepSeek برای اندروید و iOS نیز موجود است.

اخبارجدیدترین

۳۰ ریاضی‌دان مطرح از عملکرد هوش مصنوعی در حل مسائل پیچیده شگفت‌زده شدند

Runway از Act-Two رونمایی کرد؛ موشن کپچر آسان با هوش مصنوعی [تماشا کنید]

شرکت OpenAI‌ از ChatGPT Agent برای انجام خودکار کارها رونمایی کرد

DeepSeek AI استارتاپ چینی درحال‌رشدی است که به‌دلیل پیشرفت‌های خود در زمینه هوش مصنوعی موردتوجه جهان قرار گرفته است. شرکت چینی به عقیده بسیاری از کارشناسان یکی از قدرتمندترین مدل‌های هوش مصنوعی رایگان با نام دیپ‌سیک را منتشر کرده است که در ادامه این مطلب آن را معرفی خواهیم کرد.

هوش مصنوعی دیپ‌سیک چیست؟

جدیدترین نسخه از مدل هوش مصنوعی این شرکت که DeepSeek V3 نام دارد، اواخر 2024 منتشر شد و توسعه‌دهندگان می‌توانند شخصی‌سازی‌شده آن را دانلود و در برنامه‌های خود استفاده کنند. همان‌طور که اشاره کردیم، مدل‌های دیپ‌سیک کاملاً متن‌باز هستند؛ توسعه‌دهندگان می‌توانند آنها را دانلود کنند و برای استفاده در برنامه‌ها و پروژه‌های خود تغییر دهند.

این مدل هوش مصنوعی از معماری نوآورانه‌ای بهره می‌برد که در ادامه به آن می‌پردازیم. همین معماری باعث شده در مقایسه با بسیاری از مدل‌های هوش مصنوعی قدرتمند امروزی از شرکت‌هایی مانند متا و OpenAI که برای استفاه از امکانات پیشرفته آنها باید پول بپردازید، قدرتمندتر باشد.

قابلیت‌های هوش مصنوعی DeepSeek V3 و برتری آن نسبت به رقبا

دیپ سیک می‌گوید که مدل پرچم‌دار آن می‌تواند طیف وسیعی از وظایف و کارهای مبتنی‌بر متن، نظیر کدنویسی، ترجمه و نگارش مقاله و ایمیل را انجام دهد. همچنین در آموزش آن از پردازشگرهای گرافیکی H800 مخصوص چین از شرکت انویدیا استفاده شده است.

دیپ سیک با تست‌های خود اعلام کرده DeepSeek V3 هم از مدل‌های قابل‌دانلود و رایگان هم از مدل‌های غیررایگان که فقط از طریق API در دسترس هستند، بهتر عمل می‌کند. به گفته این شرکت و طبق تصویر زیر مدل هوش مصنوعی آن در کدنویسی از مدل‌های دیگر مانند Llama 3.1 متعلق به متا، GPT-4o از OpenAI و Qwen 2.5 72B شرکت چینی Alibaba بهتر عمل کرده است.

دیپ سیک ادعا کرده DeepSeek V3 با مجموعه داده‌ای از 14 تریلیون و 800 میلیارد توکن آموزش دیده است. برای درک بهتر این موضوع باید گفت هر یک‌میلیون توکن معادل حدود 750 هزار کلمه است. DeepSeek V3 از نظر اندازه نیز بسیار وسیع است و از 671 میلیارد پارامتر پشتیبانی می‌کند (پارامترها متغیرهای داخلی هستند که مدل‌های برای پیش‌بینی یا تصمیم‌گیری از آنها استفاده می‌کنند). با این شرایط، هوش مصنوعی این شرکت تقریباً 1.6 برابر از Llama 3.1 405B شرکت متا بزرگ‌تر است که از 405 میلیارد پارامتر پشتیبانی می‌کند.

نکته جالب دیگر اینکه چینی‌ها مدل پرچم‌دار خود را فقط در 2 ماه و با هزینه‌ای نزدیک به 5.58 میلیون دلار آموزش داده‌اند؛ بنابراین در مقایسه با شرکت‌های بزرگی مانند متا و OpenAI این شرکت زمان و منابع کمتری برای مدل هوش مصنوعی خود صرف کرده است.

معماری نوآورانه DeepSeek V3

دیپ سیک برای توسعه مدل خود از معماری بهینه‌شده‌ای (با نام ترکیبی-از-متخصصان یا MoE) استفاده کرده است که نیاز آن به قدرت محاسباتی گسترده و سخت‎‌افزارهای قدرتمند را کاهش می‌دهد. این معماری را تیم (متخصص) از سیستم‌های هوش مصنوعی تخصصی در نظر بگیرید که در آن هر به‌اصطلاح «متخصص» شبکه عصبی خود را دارد و برای انجام وظایف مرتبط با خود فعال می‌شوند.

در واقع این معماری پیش از انجام وظایف، پیچیدگی آنها را پیش‌بینی می‌کند و براساس منابعی که در اختیار دارد، (متخصصان) مسیر موردنیاز برای تحقق آن را تعیین می‌کند. همچنین برای انجام هریک از وظایف فقط مرتبط‌‌ترین سیستم‌های هوش مصنوعی فعال خواهند شد که این امر محاسبات اضافی را به حداقل می‌رساند و سرعت عملکرد مدل را بیشتر می‌کند.

آزمایش هوش مصنوعی دیپ سیک

برای آزمایش نحوه عملکرد هوش مصنوعی DeepSeek نیز در ادامه به چند مثال اشاره کرده‌ایم. در اولین مورد، از این مدل خواسته‌شده شرح مفصلی از شخصیتی فانتزی (ملکه‌ای که مقابل امپراتوری شیطانی مقاومت می‌کند) بنویسد. سپس DeepSeek V3 با انتخاب نام، عنوان، سن و ظاهر این شخصیت داستانی فانتزی نوشته است:

برای آزمایش مهارت این مدل در کدنویسی نیز طبق مثال زیر کد جاوا اسکریپت معیوب به آن داده شده است. همان‌طور که در تصویر زیر مشاهده می‌کنید، دیپ‌سیک بلافاصله مشکل را متوجه شده و ضمن توضیح آن، کد اصلاح‌شده را برای کاربر ارسال کرده است:

در مثال زیر، توانایی DeepSeek V3 در بهره‌وری آزمایش شده است. در آن کاربر از هوش مصنوعی خواسته دستور کار مختصری برای جلسه‌ای درباره راه‌اندازی محصولی جدید تهیه کند. سپس هوش مصنوعی فهرست موضوعات پیشنهادی خود را که می‌توان در جلسه مطرح کرد، همراه مدت برنامه‌ریزی‌شده برای آنها به کاربر ارائه کرده است:

درکل،‎ درباره عملکرد این مدل گفته شده DeepSeek طیف گسترده‌ای از وظایف مانند نوشتن و رفع مشکلات کدهای پیچیده را به‌راحتی انجام می‌دهد. همچنین این مدل می‌تواند لحن و سبک نوشته‌های خود را براساس موضوعات مختلف تنظیم کند اما DeepSeek هم مانند بسیاری از مدل‌های هوش مصنوعی دیگر در پاسخ‌ به موضوعات بسیار خاص ممکن است اطلاعات اشتباه ارائه کند. همچنین ظاهراً DeepSeek V3 تمایلی به ارائه پاسخ درباره موضوعات تاریخی حساس ندارد.

دسترسی به هوش مصنوعی DeepSeek V3

هم‌اکنون رایگان می‌توانید از نسخه وب هوش مصنوعی پرچم‌دار چینی DeepSeek V3 استفاده کنید. البته برای استفاده از آن به حساب کاربری نیاز دارید که از طریق حساب گوگل نیز می‌توان آن را ایجاد کرد. محیط کاربری این سرویس شباهت زیادی به ChatGPT دارد و می‌توانید پس از ورود به حساب خود با آن گفتگو کنید. نکته قابل‌توجه اینکه این مدل از زبان فارسی نیز پشتیبانی می‌کند و کاربران ایرانی را تحریم نکرده است.

افزون‌بر نسخه وب، درحال‌حاضر اپلیکیشن DeepSeek برای اندروید و iOS نیز موجود است.

DeepSeek AI استارتاپ چینی درحال‌رشدی است که به‌دلیل پیشرفت‌های خود در زمینه هوش مصنوعی موردتوجه جهان قرار گرفته است. شرکت چینی به عقیده بسیاری از کارشناسان یکی از قدرتمندترین مدل‌های هوش مصنوعی رایگان با نام دیپ‌سیک را منتشر کرده است که در ادامه این مطلب آن را معرفی خواهیم کرد.

هوش مصنوعی دیپ‌سیک چیست؟

جدیدترین نسخه از مدل هوش مصنوعی این شرکت که DeepSeek V3 نام دارد، اواخر 2024 منتشر شد و توسعه‌دهندگان می‌توانند شخصی‌سازی‌شده آن را دانلود و در برنامه‌های خود استفاده کنند. همان‌طور که اشاره کردیم، مدل‌های دیپ‌سیک کاملاً متن‌باز هستند؛ توسعه‌دهندگان می‌توانند آنها را دانلود کنند و برای استفاده در برنامه‌ها و پروژه‌های خود تغییر دهند.

این مدل هوش مصنوعی از معماری نوآورانه‌ای بهره می‌برد که در ادامه به آن می‌پردازیم. همین معماری باعث شده در مقایسه با بسیاری از مدل‌های هوش مصنوعی قدرتمند امروزی از شرکت‌هایی مانند متا و OpenAI که برای استفاه از امکانات پیشرفته آنها باید پول بپردازید، قدرتمندتر باشد.

قابلیت‌های هوش مصنوعی DeepSeek V3 و برتری آن نسبت به رقبا

دیپ سیک می‌گوید که مدل پرچم‌دار آن می‌تواند طیف وسیعی از وظایف و کارهای مبتنی‌بر متن، نظیر کدنویسی، ترجمه و نگارش مقاله و ایمیل را انجام دهد. همچنین در آموزش آن از پردازشگرهای گرافیکی H800 مخصوص چین از شرکت انویدیا استفاده شده است.

دیپ سیک با تست‌های خود اعلام کرده DeepSeek V3 هم از مدل‌های قابل‌دانلود و رایگان هم از مدل‌های غیررایگان که فقط از طریق API در دسترس هستند، بهتر عمل می‌کند. به گفته این شرکت و طبق تصویر زیر مدل هوش مصنوعی آن در کدنویسی از مدل‌های دیگر مانند Llama 3.1 متعلق به متا، GPT-4o از OpenAI و Qwen 2.5 72B شرکت چینی Alibaba بهتر عمل کرده است.

دیپ سیک ادعا کرده DeepSeek V3 با مجموعه داده‌ای از 14 تریلیون و 800 میلیارد توکن آموزش دیده است. برای درک بهتر این موضوع باید گفت هر یک‌میلیون توکن معادل حدود 750 هزار کلمه است. DeepSeek V3 از نظر اندازه نیز بسیار وسیع است و از 671 میلیارد پارامتر پشتیبانی می‌کند (پارامترها متغیرهای داخلی هستند که مدل‌های برای پیش‌بینی یا تصمیم‌گیری از آنها استفاده می‌کنند). با این شرایط، هوش مصنوعی این شرکت تقریباً 1.6 برابر از Llama 3.1 405B شرکت متا بزرگ‌تر است که از 405 میلیارد پارامتر پشتیبانی می‌کند.

نکته جالب دیگر اینکه چینی‌ها مدل پرچم‌دار خود را فقط در 2 ماه و با هزینه‌ای نزدیک به 5.58 میلیون دلار آموزش داده‌اند؛ بنابراین در مقایسه با شرکت‌های بزرگی مانند متا و OpenAI این شرکت زمان و منابع کمتری برای مدل هوش مصنوعی خود صرف کرده است.

معماری نوآورانه DeepSeek V3

دیپ سیک برای توسعه مدل خود از معماری بهینه‌شده‌ای (با نام ترکیبی-از-متخصصان یا MoE) استفاده کرده است که نیاز آن به قدرت محاسباتی گسترده و سخت‎‌افزارهای قدرتمند را کاهش می‌دهد. این معماری را تیم (متخصص) از سیستم‌های هوش مصنوعی تخصصی در نظر بگیرید که در آن هر به‌اصطلاح «متخصص» شبکه عصبی خود را دارد و برای انجام وظایف مرتبط با خود فعال می‌شوند.

در واقع این معماری پیش از انجام وظایف، پیچیدگی آنها را پیش‌بینی می‌کند و براساس منابعی که در اختیار دارد، (متخصصان) مسیر موردنیاز برای تحقق آن را تعیین می‌کند. همچنین برای انجام هریک از وظایف فقط مرتبط‌‌ترین سیستم‌های هوش مصنوعی فعال خواهند شد که این امر محاسبات اضافی را به حداقل می‌رساند و سرعت عملکرد مدل را بیشتر می‌کند.

آزمایش هوش مصنوعی دیپ سیک

برای آزمایش نحوه عملکرد هوش مصنوعی DeepSeek نیز در ادامه به چند مثال اشاره کرده‌ایم. در اولین مورد، از این مدل خواسته‌شده شرح مفصلی از شخصیتی فانتزی (ملکه‌ای که مقابل امپراتوری شیطانی مقاومت می‌کند) بنویسد. سپس DeepSeek V3 با انتخاب نام، عنوان، سن و ظاهر این شخصیت داستانی فانتزی نوشته است:

برای آزمایش مهارت این مدل در کدنویسی نیز طبق مثال زیر کد جاوا اسکریپت معیوب به آن داده شده است. همان‌طور که در تصویر زیر مشاهده می‌کنید، دیپ‌سیک بلافاصله مشکل را متوجه شده و ضمن توضیح آن، کد اصلاح‌شده را برای کاربر ارسال کرده است:

در مثال زیر، توانایی DeepSeek V3 در بهره‌وری آزمایش شده است. در آن کاربر از هوش مصنوعی خواسته دستور کار مختصری برای جلسه‌ای درباره راه‌اندازی محصولی جدید تهیه کند. سپس هوش مصنوعی فهرست موضوعات پیشنهادی خود را که می‌توان در جلسه مطرح کرد، همراه مدت برنامه‌ریزی‌شده برای آنها به کاربر ارائه کرده است:

درکل،‎ درباره عملکرد این مدل گفته شده DeepSeek طیف گسترده‌ای از وظایف مانند نوشتن و رفع مشکلات کدهای پیچیده را به‌راحتی انجام می‌دهد. همچنین این مدل می‌تواند لحن و سبک نوشته‌های خود را براساس موضوعات مختلف تنظیم کند اما DeepSeek هم مانند بسیاری از مدل‌های هوش مصنوعی دیگر در پاسخ‌ به موضوعات بسیار خاص ممکن است اطلاعات اشتباه ارائه کند. همچنین ظاهراً DeepSeek V3 تمایلی به ارائه پاسخ درباره موضوعات تاریخی حساس ندارد.

دسترسی به هوش مصنوعی DeepSeek V3

هم‌اکنون رایگان می‌توانید از نسخه وب هوش مصنوعی پرچم‌دار چینی DeepSeek V3 استفاده کنید. البته برای استفاده از آن به حساب کاربری نیاز دارید که از طریق حساب گوگل نیز می‌توان آن را ایجاد کرد. محیط کاربری این سرویس شباهت زیادی به ChatGPT دارد و می‌توانید پس از ورود به حساب خود با آن گفتگو کنید. نکته قابل‌توجه اینکه این مدل از زبان فارسی نیز پشتیبانی می‌کند و کاربران ایرانی را تحریم نکرده است.

افزون‌بر نسخه وب، درحال‌حاضر اپلیکیشن DeepSeek برای اندروید و iOS نیز موجود است.

پست قبلی

بریتانیا می‌خواهد رقیبی بومی برای OpenAI بسازد

پست بعدی

OpenAI با هوش مصنوعی جدید خود برای افزایش عمر انسان‌ها تلاش می‌کند

مربوطه پست ها

۳۰ ریاضی‌دان مطرح از عملکرد هوش مصنوعی در حل مسائل پیچیده شگفت‌زده شدند
هوش مصنوعی

۳۰ ریاضی‌دان مطرح از عملکرد هوش مصنوعی در حل مسائل پیچیده شگفت‌زده شدند

۲۸ تیر ۱۴۰۴
Runway از Act-Two رونمایی کرد؛ موشن کپچر آسان با هوش مصنوعی [تماشا کنید]
هوش مصنوعی

Runway از Act-Two رونمایی کرد؛ موشن کپچر آسان با هوش مصنوعی [تماشا کنید]

۲۸ تیر ۱۴۰۴
شرکت OpenAI‌ از ChatGPT Agent برای انجام خودکار کارها رونمایی کرد
هوش مصنوعی

شرکت OpenAI‌ از ChatGPT Agent برای انجام خودکار کارها رونمایی کرد

۲۶ تیر ۱۴۰۴
انتقاد شدید محققان هوش مصنوعی از فرهنگ کاری xAI: توجهی به مسائل ایمنی نمی‌شود
هوش مصنوعی

انتقاد شدید محققان هوش مصنوعی از فرهنگ کاری xAI: توجهی به مسائل ایمنی نمی‌شود

۲۶ تیر ۱۴۰۴
مدیرعامل انویدیا: هوش مصنوعی همه مشاغل را به‌طور کامل تغییر می‌دهد
هوش مصنوعی

مدیرعامل انویدیا: هوش مصنوعی همه مشاغل را به‌طور کامل تغییر می‌دهد

۲۵ تیر ۱۴۰۴
چت‌بات هوش مصنوعی Claude به‌صورت رسمی با Canva یکپارچه شد
هوش مصنوعی

چت‌بات هوش مصنوعی Claude به‌صورت رسمی با Canva یکپارچه شد

۲۵ تیر ۱۴۰۴

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

18 + هفت =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • نقش ترجمه رسمی ایتالیایی در موفقیت امور اداری، تجاری و آموزشی
  • شغل های پردرآمد در ایران
  • «شب‌های روشن» افتتاح شد؛ تعزیه در قاب عکاسانه
  • فرهنگسازی با هنر؛ تئاتر حتی در زمان جنگ‌های جهانی هم تعطیل نشده است!
  • انتشار یک سه‌گانه‌ جدید؛ نگاهی نو به نسبت روان‌کاوی با سینما و تئاتر
  • پاسینیک
  • خرید سرور ایران و خارج
  • تجارتخانه آراد برندینگ
  • ویرایش مقاله
  • تابلو لایت باکس
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • پرشین هتل
  • راحت ترین روش یادگیری انگلیسی
  • خرید سرور ابری

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.