دانش جوین
سه شنبه, تیر ۱۷, ۱۴۰۴
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
  • ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی هوش مصنوعی

استارتاپ جدید Deep Cogito اولین مدل‌های هوش مصنوعی خود را منتشر کرد؛ قدرتمند در برابر رقبا

دیجیاتو توسط دیجیاتو
۲۰ فروردین ۱۴۰۴
در هوش مصنوعی
زمان خواندن: زمان موردنیاز برای مطالعه: 3 دقیقه
1
استارتاپ جدید Deep Cogito اولین مدل‌های هوش مصنوعی خود را منتشر کرد؛ قدرتمند در برابر رقبا
9
بازدیدها
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

استارتاپ جدید Deep Cogito که در زمینه تحقیقات هوش مصنوعی فعالیت می‌کند، به‌طور رسمی مدل‌های زبانی قدرتمند خود را معرفی کرد. این مدل‌ها عملکردی مشابه مدل‌های رقیب دارند.

Deep Cogito که در سن‌فرانسیسکو مستقر است، مدل‌های «Cogito v1» را معرفی کرده که بر پایه نسخه 3.2 از LLaMA (محصول متا) توسعه یافته‌اند و از قابلیت «استدلال ترکیبی» بهره می‌برند؛ قابلیتی که هم پاسخ‌دهی سریع و مستقیم را ممکن می‌کند هم نوعی بازاندیشی مشابه مدل‌های سری «o» شرکت OpenAI و DeepSeek R1 را.

هدف نهایی Deep Cogito توسعه هوش فراانسانی است؛ مدلی از هوش مصنوعی که بتواند در تمام حوزه‌ها از انسان پیشی بگیرد اما این شرکت تأکید می‌کند تمام مدل‌هایش متن‌باز خواهند بود.

به گفته «دریشان آرورا» (Drishan Arora)، مدیرعامل و هم‌بنیان‌گذار این استارتاپ که سابقه فعالیت به‌عنوان مهندس ارشد در گوگل و مشارکت در توسعه موتور جستجوی این شرکت را دارد، مدل‌های آنها در ابعاد خود قوی‌ترین مدل‌های متن‌بازند و حتی از مدل‌های لاما، DeepSeek و Qwen نیز پیشی می‌گیرند.

نسخه اولیه مدل‌های Cogito در ۵ اندازه 3، 8، 14، 32 و 70 میلیارد پارامتر منتشر شده‌اند و هم‌اکنون در پلتفرم‌های Hugging Face ،Ollama و APIهای Fireworks و Together AI در دسترس قرار دارند. این مدل‌ها تحت لایسنس LLaMA منتشر شده‌اند که اجازه استفاده تجاری تا سقف 700 میلیون کاربر ماهانه را فراهم می‌کند؛ درصورتی‌که استفاده از مدل از این سقف عبور کند، گرفتن مجوز پولی از متا الزامی خواهد بود.

Deep Cogito از رویکردی جدید با نام «تقطیر و تقویت تکراری» (Iterated Distillation and Amplification یا IDA) برای آموزش مدل‌های خود استفاده کرده است. برخلاف روش رایج RLHF (تقویت با بازخورد انسانی)، در روش IDA به مدل اجازه داده می‌شود با اختصاص محاسبات بیشتر، راه‌حل‌های بهینه‌تری تولید کند و این روند تفکر بهینه را در پارامترهایش یاد بگیرد.

عملکرد مدل‌های هوش مصنوعی Cogito در بنچمارک

مدل‌های Cogito عملکرد چشمگیری در آزمون‌های مختلف از خود نشان داده‌اند:

  • Cogito 3B با امتیاز 65.4 درصد در MMLU، مدل LLaMA 3.2 3B را با اختلاف 6.7 درصد شکست داده است. در آزمون Hellaswag نیز 18.8 درصد عملکرد بهتری داشته است.
  • Cogito 8B با کسب امتیاز 80.5 درصد در MMLU، مدل LLaMA 3.1 8B را با اختلاف 12.8 درصد پشت سر گذاشته است.
  • در حالت Reasoning یا استدلال، نسخه 8B موفق شده به امتیاز 92 درصد در آزمون ARC و 83.1 درصد در MMLU دست یابد و از DeepSeek R1 Distill 8B پیشی بگیرد.

درمجموع، عملکرد مدل‌های Cogito در حالت Reasoning بالاترین نتایج را داشته است، هرچند در برخی موارد، به‌ویژه در آزمون ریاضی MATH، مدل‌های دیگر مثل DeepSeek R1 همچنان برتری نسبی دارند.

به گفته این شرکت، نسخه‌هایی بسیار بزرگ‌تر از این مدل‌ها نیز در راه است و مدل‌هایی با ابعاد 109، 400 و حتی 671 میلیارد پارامتر طی ماه‌های آینده عرضه خواهند شد.

استارتاپ جدید Deep Cogito که در زمینه تحقیقات هوش مصنوعی فعالیت می‌کند، به‌طور رسمی مدل‌های زبانی قدرتمند خود را معرفی کرد. این مدل‌ها عملکردی مشابه مدل‌های رقیب دارند.

Deep Cogito که در سن‌فرانسیسکو مستقر است، مدل‌های «Cogito v1» را معرفی کرده که بر پایه نسخه 3.2 از LLaMA (محصول متا) توسعه یافته‌اند و از قابلیت «استدلال ترکیبی» بهره می‌برند؛ قابلیتی که هم پاسخ‌دهی سریع و مستقیم را ممکن می‌کند هم نوعی بازاندیشی مشابه مدل‌های سری «o» شرکت OpenAI و DeepSeek R1 را.

هدف نهایی Deep Cogito توسعه هوش فراانسانی است؛ مدلی از هوش مصنوعی که بتواند در تمام حوزه‌ها از انسان پیشی بگیرد اما این شرکت تأکید می‌کند تمام مدل‌هایش متن‌باز خواهند بود.

به گفته «دریشان آرورا» (Drishan Arora)، مدیرعامل و هم‌بنیان‌گذار این استارتاپ که سابقه فعالیت به‌عنوان مهندس ارشد در گوگل و مشارکت در توسعه موتور جستجوی این شرکت را دارد، مدل‌های آنها در ابعاد خود قوی‌ترین مدل‌های متن‌بازند و حتی از مدل‌های لاما، DeepSeek و Qwen نیز پیشی می‌گیرند.

نسخه اولیه مدل‌های Cogito در ۵ اندازه 3، 8، 14، 32 و 70 میلیارد پارامتر منتشر شده‌اند و هم‌اکنون در پلتفرم‌های Hugging Face ،Ollama و APIهای Fireworks و Together AI در دسترس قرار دارند. این مدل‌ها تحت لایسنس LLaMA منتشر شده‌اند که اجازه استفاده تجاری تا سقف 700 میلیون کاربر ماهانه را فراهم می‌کند؛ درصورتی‌که استفاده از مدل از این سقف عبور کند، گرفتن مجوز پولی از متا الزامی خواهد بود.

Deep Cogito از رویکردی جدید با نام «تقطیر و تقویت تکراری» (Iterated Distillation and Amplification یا IDA) برای آموزش مدل‌های خود استفاده کرده است. برخلاف روش رایج RLHF (تقویت با بازخورد انسانی)، در روش IDA به مدل اجازه داده می‌شود با اختصاص محاسبات بیشتر، راه‌حل‌های بهینه‌تری تولید کند و این روند تفکر بهینه را در پارامترهایش یاد بگیرد.

عملکرد مدل‌های هوش مصنوعی Cogito در بنچمارک

مدل‌های Cogito عملکرد چشمگیری در آزمون‌های مختلف از خود نشان داده‌اند:

  • Cogito 3B با امتیاز 65.4 درصد در MMLU، مدل LLaMA 3.2 3B را با اختلاف 6.7 درصد شکست داده است. در آزمون Hellaswag نیز 18.8 درصد عملکرد بهتری داشته است.
  • Cogito 8B با کسب امتیاز 80.5 درصد در MMLU، مدل LLaMA 3.1 8B را با اختلاف 12.8 درصد پشت سر گذاشته است.
  • در حالت Reasoning یا استدلال، نسخه 8B موفق شده به امتیاز 92 درصد در آزمون ARC و 83.1 درصد در MMLU دست یابد و از DeepSeek R1 Distill 8B پیشی بگیرد.

درمجموع، عملکرد مدل‌های Cogito در حالت Reasoning بالاترین نتایج را داشته است، هرچند در برخی موارد، به‌ویژه در آزمون ریاضی MATH، مدل‌های دیگر مثل DeepSeek R1 همچنان برتری نسبی دارند.

به گفته این شرکت، نسخه‌هایی بسیار بزرگ‌تر از این مدل‌ها نیز در راه است و مدل‌هایی با ابعاد 109، 400 و حتی 671 میلیارد پارامتر طی ماه‌های آینده عرضه خواهند شد.

اخبارجدیدترین

اپل مدل هوش مصنوعی متفاوت و جذابی را برای برنامه‌نویسی منتشر کرد

محققان:‌ در ۱۴ درصد از مقالات علمی نشانه‌های استفاده از هوش مصنوعی وجود دارد

سیری هوشمند احتمالاً با کمک OpenAI یا آنتروپیک ساخته می‌شود

استارتاپ جدید Deep Cogito که در زمینه تحقیقات هوش مصنوعی فعالیت می‌کند، به‌طور رسمی مدل‌های زبانی قدرتمند خود را معرفی کرد. این مدل‌ها عملکردی مشابه مدل‌های رقیب دارند.

Deep Cogito که در سن‌فرانسیسکو مستقر است، مدل‌های «Cogito v1» را معرفی کرده که بر پایه نسخه 3.2 از LLaMA (محصول متا) توسعه یافته‌اند و از قابلیت «استدلال ترکیبی» بهره می‌برند؛ قابلیتی که هم پاسخ‌دهی سریع و مستقیم را ممکن می‌کند هم نوعی بازاندیشی مشابه مدل‌های سری «o» شرکت OpenAI و DeepSeek R1 را.

هدف نهایی Deep Cogito توسعه هوش فراانسانی است؛ مدلی از هوش مصنوعی که بتواند در تمام حوزه‌ها از انسان پیشی بگیرد اما این شرکت تأکید می‌کند تمام مدل‌هایش متن‌باز خواهند بود.

به گفته «دریشان آرورا» (Drishan Arora)، مدیرعامل و هم‌بنیان‌گذار این استارتاپ که سابقه فعالیت به‌عنوان مهندس ارشد در گوگل و مشارکت در توسعه موتور جستجوی این شرکت را دارد، مدل‌های آنها در ابعاد خود قوی‌ترین مدل‌های متن‌بازند و حتی از مدل‌های لاما، DeepSeek و Qwen نیز پیشی می‌گیرند.

نسخه اولیه مدل‌های Cogito در ۵ اندازه 3، 8، 14، 32 و 70 میلیارد پارامتر منتشر شده‌اند و هم‌اکنون در پلتفرم‌های Hugging Face ،Ollama و APIهای Fireworks و Together AI در دسترس قرار دارند. این مدل‌ها تحت لایسنس LLaMA منتشر شده‌اند که اجازه استفاده تجاری تا سقف 700 میلیون کاربر ماهانه را فراهم می‌کند؛ درصورتی‌که استفاده از مدل از این سقف عبور کند، گرفتن مجوز پولی از متا الزامی خواهد بود.

Deep Cogito از رویکردی جدید با نام «تقطیر و تقویت تکراری» (Iterated Distillation and Amplification یا IDA) برای آموزش مدل‌های خود استفاده کرده است. برخلاف روش رایج RLHF (تقویت با بازخورد انسانی)، در روش IDA به مدل اجازه داده می‌شود با اختصاص محاسبات بیشتر، راه‌حل‌های بهینه‌تری تولید کند و این روند تفکر بهینه را در پارامترهایش یاد بگیرد.

عملکرد مدل‌های هوش مصنوعی Cogito در بنچمارک

مدل‌های Cogito عملکرد چشمگیری در آزمون‌های مختلف از خود نشان داده‌اند:

  • Cogito 3B با امتیاز 65.4 درصد در MMLU، مدل LLaMA 3.2 3B را با اختلاف 6.7 درصد شکست داده است. در آزمون Hellaswag نیز 18.8 درصد عملکرد بهتری داشته است.
  • Cogito 8B با کسب امتیاز 80.5 درصد در MMLU، مدل LLaMA 3.1 8B را با اختلاف 12.8 درصد پشت سر گذاشته است.
  • در حالت Reasoning یا استدلال، نسخه 8B موفق شده به امتیاز 92 درصد در آزمون ARC و 83.1 درصد در MMLU دست یابد و از DeepSeek R1 Distill 8B پیشی بگیرد.

درمجموع، عملکرد مدل‌های Cogito در حالت Reasoning بالاترین نتایج را داشته است، هرچند در برخی موارد، به‌ویژه در آزمون ریاضی MATH، مدل‌های دیگر مثل DeepSeek R1 همچنان برتری نسبی دارند.

به گفته این شرکت، نسخه‌هایی بسیار بزرگ‌تر از این مدل‌ها نیز در راه است و مدل‌هایی با ابعاد 109، 400 و حتی 671 میلیارد پارامتر طی ماه‌های آینده عرضه خواهند شد.

استارتاپ جدید Deep Cogito که در زمینه تحقیقات هوش مصنوعی فعالیت می‌کند، به‌طور رسمی مدل‌های زبانی قدرتمند خود را معرفی کرد. این مدل‌ها عملکردی مشابه مدل‌های رقیب دارند.

Deep Cogito که در سن‌فرانسیسکو مستقر است، مدل‌های «Cogito v1» را معرفی کرده که بر پایه نسخه 3.2 از LLaMA (محصول متا) توسعه یافته‌اند و از قابلیت «استدلال ترکیبی» بهره می‌برند؛ قابلیتی که هم پاسخ‌دهی سریع و مستقیم را ممکن می‌کند هم نوعی بازاندیشی مشابه مدل‌های سری «o» شرکت OpenAI و DeepSeek R1 را.

هدف نهایی Deep Cogito توسعه هوش فراانسانی است؛ مدلی از هوش مصنوعی که بتواند در تمام حوزه‌ها از انسان پیشی بگیرد اما این شرکت تأکید می‌کند تمام مدل‌هایش متن‌باز خواهند بود.

به گفته «دریشان آرورا» (Drishan Arora)، مدیرعامل و هم‌بنیان‌گذار این استارتاپ که سابقه فعالیت به‌عنوان مهندس ارشد در گوگل و مشارکت در توسعه موتور جستجوی این شرکت را دارد، مدل‌های آنها در ابعاد خود قوی‌ترین مدل‌های متن‌بازند و حتی از مدل‌های لاما، DeepSeek و Qwen نیز پیشی می‌گیرند.

نسخه اولیه مدل‌های Cogito در ۵ اندازه 3، 8، 14، 32 و 70 میلیارد پارامتر منتشر شده‌اند و هم‌اکنون در پلتفرم‌های Hugging Face ،Ollama و APIهای Fireworks و Together AI در دسترس قرار دارند. این مدل‌ها تحت لایسنس LLaMA منتشر شده‌اند که اجازه استفاده تجاری تا سقف 700 میلیون کاربر ماهانه را فراهم می‌کند؛ درصورتی‌که استفاده از مدل از این سقف عبور کند، گرفتن مجوز پولی از متا الزامی خواهد بود.

Deep Cogito از رویکردی جدید با نام «تقطیر و تقویت تکراری» (Iterated Distillation and Amplification یا IDA) برای آموزش مدل‌های خود استفاده کرده است. برخلاف روش رایج RLHF (تقویت با بازخورد انسانی)، در روش IDA به مدل اجازه داده می‌شود با اختصاص محاسبات بیشتر، راه‌حل‌های بهینه‌تری تولید کند و این روند تفکر بهینه را در پارامترهایش یاد بگیرد.

عملکرد مدل‌های هوش مصنوعی Cogito در بنچمارک

مدل‌های Cogito عملکرد چشمگیری در آزمون‌های مختلف از خود نشان داده‌اند:

  • Cogito 3B با امتیاز 65.4 درصد در MMLU، مدل LLaMA 3.2 3B را با اختلاف 6.7 درصد شکست داده است. در آزمون Hellaswag نیز 18.8 درصد عملکرد بهتری داشته است.
  • Cogito 8B با کسب امتیاز 80.5 درصد در MMLU، مدل LLaMA 3.1 8B را با اختلاف 12.8 درصد پشت سر گذاشته است.
  • در حالت Reasoning یا استدلال، نسخه 8B موفق شده به امتیاز 92 درصد در آزمون ARC و 83.1 درصد در MMLU دست یابد و از DeepSeek R1 Distill 8B پیشی بگیرد.

درمجموع، عملکرد مدل‌های Cogito در حالت Reasoning بالاترین نتایج را داشته است، هرچند در برخی موارد، به‌ویژه در آزمون ریاضی MATH، مدل‌های دیگر مثل DeepSeek R1 همچنان برتری نسبی دارند.

به گفته این شرکت، نسخه‌هایی بسیار بزرگ‌تر از این مدل‌ها نیز در راه است و مدل‌هایی با ابعاد 109، 400 و حتی 671 میلیارد پارامتر طی ماه‌های آینده عرضه خواهند شد.

پست قبلی

بازار مسکن در وضعیت انتظار؛ نه سیگنال رشد، نه نشانه سقوط

پست بعدی

نامه پزشکیان به عارف و انتقاد از منع صادرات محصولات کشاورزی

مربوطه پست ها

اپل مدل هوش مصنوعی متفاوت و جذابی را برای برنامه‌نویسی منتشر کرد
هوش مصنوعی

اپل مدل هوش مصنوعی متفاوت و جذابی را برای برنامه‌نویسی منتشر کرد

۱۵ تیر ۱۴۰۴
محققان:‌ در ۱۴ درصد از مقالات علمی نشانه‌های استفاده از هوش مصنوعی وجود دارد
هوش مصنوعی

محققان:‌ در ۱۴ درصد از مقالات علمی نشانه‌های استفاده از هوش مصنوعی وجود دارد

۱۴ تیر ۱۴۰۴
سیری هوشمند احتمالاً با کمک OpenAI یا آنتروپیک ساخته می‌شود
هوش مصنوعی

سیری هوشمند احتمالاً با کمک OpenAI یا آنتروپیک ساخته می‌شود

۱۰ تیر ۱۴۰۴
مارک زاکربرگ از آزمایشگاه هوش مصنوعی جدید متا رونمایی کرد؛ رقابت جدی‌تر با OpenAI
هوش مصنوعی

مارک زاکربرگ از آزمایشگاه هوش مصنوعی جدید متا رونمایی کرد؛ رقابت جدی‌تر با OpenAI

۱۰ تیر ۱۴۰۴
اولین مسابقه فوتبال ربات‌های انسان‌نما با هوش مصنوعی در چین برگزار شد [تماشا کنید]
هوش مصنوعی

اولین مسابقه فوتبال ربات‌های انسان‌نما با هوش مصنوعی در چین برگزار شد [تماشا کنید]

۱۰ تیر ۱۴۰۴
مدیرعامل آمازون می‌گوید هوش مصنوعی نیاز به کارمندان را کاهش خواهد داد
هوش مصنوعی

مدیرعامل آمازون می‌گوید هوش مصنوعی نیاز به کارمندان را کاهش خواهد داد

۱۰ تیر ۱۴۰۴

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

4 × 2 =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • یارانه‌بگیران بخوانند؛ زمان دقیق واریز یارانه جدید تیرماه اعلام شد
  • قیمت ارز‌های دیجیتال امروز دوشنبه ۱۶ تیر ۱۴۰۴
  • قیمت بیت کوین امروز دوشنبه ۱۶ تیرماه ۱۴۰۴
  • قیمت تتر امروز دوشنبه ۱۶ تیرماه ۱۴۰۴
  • حداقل بودجه برای رهن آپارتمان 2خوابه در تهران؛ از ۵۰۰ میلیون تا یک میلیارد تومان
  • پاسینیک
  • خرید سرور hp
  • خرید سرور ایران و خارج
  • مانیتور ساینا کوییک
  • خرید یوسی
  • حوله استخری
  • خرید قهوه
  • تجارتخانه آراد برندینگ
  • ویرایش مقاله
  • تابلو لایت باکس
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • قیمت هاست فروشگاهی
  • پرشین هتل
  • خرید لیفتراک دست دوم
  • آموزش علوم اول ابتدایی
  • راحت ترین روش یادگیری انگلیسی

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.