دانش جوین
سه شنبه, تیر ۱۷, ۱۴۰۴
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
  • ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی هوش مصنوعی

استارتاپ جدید Deep Cogito اولین مدل‌های هوش مصنوعی خود را منتشر کرد؛ قدرتمند در برابر رقبا

دیجیاتو توسط دیجیاتو
۲۰ فروردین ۱۴۰۴
در هوش مصنوعی
زمان خواندن: زمان موردنیاز برای مطالعه: 3 دقیقه
1
استارتاپ جدید Deep Cogito اولین مدل‌های هوش مصنوعی خود را منتشر کرد؛ قدرتمند در برابر رقبا
9
بازدیدها
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

استارتاپ جدید Deep Cogito که در زمینه تحقیقات هوش مصنوعی فعالیت می‌کند، به‌طور رسمی مدل‌های زبانی قدرتمند خود را معرفی کرد. این مدل‌ها عملکردی مشابه مدل‌های رقیب دارند.

Deep Cogito که در سن‌فرانسیسکو مستقر است، مدل‌های «Cogito v1» را معرفی کرده که بر پایه نسخه 3.2 از LLaMA (محصول متا) توسعه یافته‌اند و از قابلیت «استدلال ترکیبی» بهره می‌برند؛ قابلیتی که هم پاسخ‌دهی سریع و مستقیم را ممکن می‌کند هم نوعی بازاندیشی مشابه مدل‌های سری «o» شرکت OpenAI و DeepSeek R1 را.

هدف نهایی Deep Cogito توسعه هوش فراانسانی است؛ مدلی از هوش مصنوعی که بتواند در تمام حوزه‌ها از انسان پیشی بگیرد اما این شرکت تأکید می‌کند تمام مدل‌هایش متن‌باز خواهند بود.

به گفته «دریشان آرورا» (Drishan Arora)، مدیرعامل و هم‌بنیان‌گذار این استارتاپ که سابقه فعالیت به‌عنوان مهندس ارشد در گوگل و مشارکت در توسعه موتور جستجوی این شرکت را دارد، مدل‌های آنها در ابعاد خود قوی‌ترین مدل‌های متن‌بازند و حتی از مدل‌های لاما، DeepSeek و Qwen نیز پیشی می‌گیرند.

نسخه اولیه مدل‌های Cogito در ۵ اندازه 3، 8، 14، 32 و 70 میلیارد پارامتر منتشر شده‌اند و هم‌اکنون در پلتفرم‌های Hugging Face ،Ollama و APIهای Fireworks و Together AI در دسترس قرار دارند. این مدل‌ها تحت لایسنس LLaMA منتشر شده‌اند که اجازه استفاده تجاری تا سقف 700 میلیون کاربر ماهانه را فراهم می‌کند؛ درصورتی‌که استفاده از مدل از این سقف عبور کند، گرفتن مجوز پولی از متا الزامی خواهد بود.

Deep Cogito از رویکردی جدید با نام «تقطیر و تقویت تکراری» (Iterated Distillation and Amplification یا IDA) برای آموزش مدل‌های خود استفاده کرده است. برخلاف روش رایج RLHF (تقویت با بازخورد انسانی)، در روش IDA به مدل اجازه داده می‌شود با اختصاص محاسبات بیشتر، راه‌حل‌های بهینه‌تری تولید کند و این روند تفکر بهینه را در پارامترهایش یاد بگیرد.

عملکرد مدل‌های هوش مصنوعی Cogito در بنچمارک

مدل‌های Cogito عملکرد چشمگیری در آزمون‌های مختلف از خود نشان داده‌اند:

  • Cogito 3B با امتیاز 65.4 درصد در MMLU، مدل LLaMA 3.2 3B را با اختلاف 6.7 درصد شکست داده است. در آزمون Hellaswag نیز 18.8 درصد عملکرد بهتری داشته است.
  • Cogito 8B با کسب امتیاز 80.5 درصد در MMLU، مدل LLaMA 3.1 8B را با اختلاف 12.8 درصد پشت سر گذاشته است.
  • در حالت Reasoning یا استدلال، نسخه 8B موفق شده به امتیاز 92 درصد در آزمون ARC و 83.1 درصد در MMLU دست یابد و از DeepSeek R1 Distill 8B پیشی بگیرد.

درمجموع، عملکرد مدل‌های Cogito در حالت Reasoning بالاترین نتایج را داشته است، هرچند در برخی موارد، به‌ویژه در آزمون ریاضی MATH، مدل‌های دیگر مثل DeepSeek R1 همچنان برتری نسبی دارند.

به گفته این شرکت، نسخه‌هایی بسیار بزرگ‌تر از این مدل‌ها نیز در راه است و مدل‌هایی با ابعاد 109، 400 و حتی 671 میلیارد پارامتر طی ماه‌های آینده عرضه خواهند شد.

استارتاپ جدید Deep Cogito که در زمینه تحقیقات هوش مصنوعی فعالیت می‌کند، به‌طور رسمی مدل‌های زبانی قدرتمند خود را معرفی کرد. این مدل‌ها عملکردی مشابه مدل‌های رقیب دارند.

Deep Cogito که در سن‌فرانسیسکو مستقر است، مدل‌های «Cogito v1» را معرفی کرده که بر پایه نسخه 3.2 از LLaMA (محصول متا) توسعه یافته‌اند و از قابلیت «استدلال ترکیبی» بهره می‌برند؛ قابلیتی که هم پاسخ‌دهی سریع و مستقیم را ممکن می‌کند هم نوعی بازاندیشی مشابه مدل‌های سری «o» شرکت OpenAI و DeepSeek R1 را.

هدف نهایی Deep Cogito توسعه هوش فراانسانی است؛ مدلی از هوش مصنوعی که بتواند در تمام حوزه‌ها از انسان پیشی بگیرد اما این شرکت تأکید می‌کند تمام مدل‌هایش متن‌باز خواهند بود.

به گفته «دریشان آرورا» (Drishan Arora)، مدیرعامل و هم‌بنیان‌گذار این استارتاپ که سابقه فعالیت به‌عنوان مهندس ارشد در گوگل و مشارکت در توسعه موتور جستجوی این شرکت را دارد، مدل‌های آنها در ابعاد خود قوی‌ترین مدل‌های متن‌بازند و حتی از مدل‌های لاما، DeepSeek و Qwen نیز پیشی می‌گیرند.

نسخه اولیه مدل‌های Cogito در ۵ اندازه 3، 8، 14، 32 و 70 میلیارد پارامتر منتشر شده‌اند و هم‌اکنون در پلتفرم‌های Hugging Face ،Ollama و APIهای Fireworks و Together AI در دسترس قرار دارند. این مدل‌ها تحت لایسنس LLaMA منتشر شده‌اند که اجازه استفاده تجاری تا سقف 700 میلیون کاربر ماهانه را فراهم می‌کند؛ درصورتی‌که استفاده از مدل از این سقف عبور کند، گرفتن مجوز پولی از متا الزامی خواهد بود.

Deep Cogito از رویکردی جدید با نام «تقطیر و تقویت تکراری» (Iterated Distillation and Amplification یا IDA) برای آموزش مدل‌های خود استفاده کرده است. برخلاف روش رایج RLHF (تقویت با بازخورد انسانی)، در روش IDA به مدل اجازه داده می‌شود با اختصاص محاسبات بیشتر، راه‌حل‌های بهینه‌تری تولید کند و این روند تفکر بهینه را در پارامترهایش یاد بگیرد.

عملکرد مدل‌های هوش مصنوعی Cogito در بنچمارک

مدل‌های Cogito عملکرد چشمگیری در آزمون‌های مختلف از خود نشان داده‌اند:

  • Cogito 3B با امتیاز 65.4 درصد در MMLU، مدل LLaMA 3.2 3B را با اختلاف 6.7 درصد شکست داده است. در آزمون Hellaswag نیز 18.8 درصد عملکرد بهتری داشته است.
  • Cogito 8B با کسب امتیاز 80.5 درصد در MMLU، مدل LLaMA 3.1 8B را با اختلاف 12.8 درصد پشت سر گذاشته است.
  • در حالت Reasoning یا استدلال، نسخه 8B موفق شده به امتیاز 92 درصد در آزمون ARC و 83.1 درصد در MMLU دست یابد و از DeepSeek R1 Distill 8B پیشی بگیرد.

درمجموع، عملکرد مدل‌های Cogito در حالت Reasoning بالاترین نتایج را داشته است، هرچند در برخی موارد، به‌ویژه در آزمون ریاضی MATH، مدل‌های دیگر مثل DeepSeek R1 همچنان برتری نسبی دارند.

به گفته این شرکت، نسخه‌هایی بسیار بزرگ‌تر از این مدل‌ها نیز در راه است و مدل‌هایی با ابعاد 109، 400 و حتی 671 میلیارد پارامتر طی ماه‌های آینده عرضه خواهند شد.

اخبارجدیدترین

نسخه جدید گراک از دموکرات‌ها و مدیران یهودی هالیوود انتقاد کرد

مقابله جدی‌تر با دیپ‌فیک‌ها؛ شهروندان دانمارک مالک کپی‌رایت چهره خود می‌شوند

اپل مدل هوش مصنوعی متفاوت و جذابی را برای برنامه‌نویسی منتشر کرد

استارتاپ جدید Deep Cogito که در زمینه تحقیقات هوش مصنوعی فعالیت می‌کند، به‌طور رسمی مدل‌های زبانی قدرتمند خود را معرفی کرد. این مدل‌ها عملکردی مشابه مدل‌های رقیب دارند.

Deep Cogito که در سن‌فرانسیسکو مستقر است، مدل‌های «Cogito v1» را معرفی کرده که بر پایه نسخه 3.2 از LLaMA (محصول متا) توسعه یافته‌اند و از قابلیت «استدلال ترکیبی» بهره می‌برند؛ قابلیتی که هم پاسخ‌دهی سریع و مستقیم را ممکن می‌کند هم نوعی بازاندیشی مشابه مدل‌های سری «o» شرکت OpenAI و DeepSeek R1 را.

هدف نهایی Deep Cogito توسعه هوش فراانسانی است؛ مدلی از هوش مصنوعی که بتواند در تمام حوزه‌ها از انسان پیشی بگیرد اما این شرکت تأکید می‌کند تمام مدل‌هایش متن‌باز خواهند بود.

به گفته «دریشان آرورا» (Drishan Arora)، مدیرعامل و هم‌بنیان‌گذار این استارتاپ که سابقه فعالیت به‌عنوان مهندس ارشد در گوگل و مشارکت در توسعه موتور جستجوی این شرکت را دارد، مدل‌های آنها در ابعاد خود قوی‌ترین مدل‌های متن‌بازند و حتی از مدل‌های لاما، DeepSeek و Qwen نیز پیشی می‌گیرند.

نسخه اولیه مدل‌های Cogito در ۵ اندازه 3، 8، 14، 32 و 70 میلیارد پارامتر منتشر شده‌اند و هم‌اکنون در پلتفرم‌های Hugging Face ،Ollama و APIهای Fireworks و Together AI در دسترس قرار دارند. این مدل‌ها تحت لایسنس LLaMA منتشر شده‌اند که اجازه استفاده تجاری تا سقف 700 میلیون کاربر ماهانه را فراهم می‌کند؛ درصورتی‌که استفاده از مدل از این سقف عبور کند، گرفتن مجوز پولی از متا الزامی خواهد بود.

Deep Cogito از رویکردی جدید با نام «تقطیر و تقویت تکراری» (Iterated Distillation and Amplification یا IDA) برای آموزش مدل‌های خود استفاده کرده است. برخلاف روش رایج RLHF (تقویت با بازخورد انسانی)، در روش IDA به مدل اجازه داده می‌شود با اختصاص محاسبات بیشتر، راه‌حل‌های بهینه‌تری تولید کند و این روند تفکر بهینه را در پارامترهایش یاد بگیرد.

عملکرد مدل‌های هوش مصنوعی Cogito در بنچمارک

مدل‌های Cogito عملکرد چشمگیری در آزمون‌های مختلف از خود نشان داده‌اند:

  • Cogito 3B با امتیاز 65.4 درصد در MMLU، مدل LLaMA 3.2 3B را با اختلاف 6.7 درصد شکست داده است. در آزمون Hellaswag نیز 18.8 درصد عملکرد بهتری داشته است.
  • Cogito 8B با کسب امتیاز 80.5 درصد در MMLU، مدل LLaMA 3.1 8B را با اختلاف 12.8 درصد پشت سر گذاشته است.
  • در حالت Reasoning یا استدلال، نسخه 8B موفق شده به امتیاز 92 درصد در آزمون ARC و 83.1 درصد در MMLU دست یابد و از DeepSeek R1 Distill 8B پیشی بگیرد.

درمجموع، عملکرد مدل‌های Cogito در حالت Reasoning بالاترین نتایج را داشته است، هرچند در برخی موارد، به‌ویژه در آزمون ریاضی MATH، مدل‌های دیگر مثل DeepSeek R1 همچنان برتری نسبی دارند.

به گفته این شرکت، نسخه‌هایی بسیار بزرگ‌تر از این مدل‌ها نیز در راه است و مدل‌هایی با ابعاد 109، 400 و حتی 671 میلیارد پارامتر طی ماه‌های آینده عرضه خواهند شد.

استارتاپ جدید Deep Cogito که در زمینه تحقیقات هوش مصنوعی فعالیت می‌کند، به‌طور رسمی مدل‌های زبانی قدرتمند خود را معرفی کرد. این مدل‌ها عملکردی مشابه مدل‌های رقیب دارند.

Deep Cogito که در سن‌فرانسیسکو مستقر است، مدل‌های «Cogito v1» را معرفی کرده که بر پایه نسخه 3.2 از LLaMA (محصول متا) توسعه یافته‌اند و از قابلیت «استدلال ترکیبی» بهره می‌برند؛ قابلیتی که هم پاسخ‌دهی سریع و مستقیم را ممکن می‌کند هم نوعی بازاندیشی مشابه مدل‌های سری «o» شرکت OpenAI و DeepSeek R1 را.

هدف نهایی Deep Cogito توسعه هوش فراانسانی است؛ مدلی از هوش مصنوعی که بتواند در تمام حوزه‌ها از انسان پیشی بگیرد اما این شرکت تأکید می‌کند تمام مدل‌هایش متن‌باز خواهند بود.

به گفته «دریشان آرورا» (Drishan Arora)، مدیرعامل و هم‌بنیان‌گذار این استارتاپ که سابقه فعالیت به‌عنوان مهندس ارشد در گوگل و مشارکت در توسعه موتور جستجوی این شرکت را دارد، مدل‌های آنها در ابعاد خود قوی‌ترین مدل‌های متن‌بازند و حتی از مدل‌های لاما، DeepSeek و Qwen نیز پیشی می‌گیرند.

نسخه اولیه مدل‌های Cogito در ۵ اندازه 3، 8، 14، 32 و 70 میلیارد پارامتر منتشر شده‌اند و هم‌اکنون در پلتفرم‌های Hugging Face ،Ollama و APIهای Fireworks و Together AI در دسترس قرار دارند. این مدل‌ها تحت لایسنس LLaMA منتشر شده‌اند که اجازه استفاده تجاری تا سقف 700 میلیون کاربر ماهانه را فراهم می‌کند؛ درصورتی‌که استفاده از مدل از این سقف عبور کند، گرفتن مجوز پولی از متا الزامی خواهد بود.

Deep Cogito از رویکردی جدید با نام «تقطیر و تقویت تکراری» (Iterated Distillation and Amplification یا IDA) برای آموزش مدل‌های خود استفاده کرده است. برخلاف روش رایج RLHF (تقویت با بازخورد انسانی)، در روش IDA به مدل اجازه داده می‌شود با اختصاص محاسبات بیشتر، راه‌حل‌های بهینه‌تری تولید کند و این روند تفکر بهینه را در پارامترهایش یاد بگیرد.

عملکرد مدل‌های هوش مصنوعی Cogito در بنچمارک

مدل‌های Cogito عملکرد چشمگیری در آزمون‌های مختلف از خود نشان داده‌اند:

  • Cogito 3B با امتیاز 65.4 درصد در MMLU، مدل LLaMA 3.2 3B را با اختلاف 6.7 درصد شکست داده است. در آزمون Hellaswag نیز 18.8 درصد عملکرد بهتری داشته است.
  • Cogito 8B با کسب امتیاز 80.5 درصد در MMLU، مدل LLaMA 3.1 8B را با اختلاف 12.8 درصد پشت سر گذاشته است.
  • در حالت Reasoning یا استدلال، نسخه 8B موفق شده به امتیاز 92 درصد در آزمون ARC و 83.1 درصد در MMLU دست یابد و از DeepSeek R1 Distill 8B پیشی بگیرد.

درمجموع، عملکرد مدل‌های Cogito در حالت Reasoning بالاترین نتایج را داشته است، هرچند در برخی موارد، به‌ویژه در آزمون ریاضی MATH، مدل‌های دیگر مثل DeepSeek R1 همچنان برتری نسبی دارند.

به گفته این شرکت، نسخه‌هایی بسیار بزرگ‌تر از این مدل‌ها نیز در راه است و مدل‌هایی با ابعاد 109، 400 و حتی 671 میلیارد پارامتر طی ماه‌های آینده عرضه خواهند شد.

پست قبلی

بازار مسکن در وضعیت انتظار؛ نه سیگنال رشد، نه نشانه سقوط

پست بعدی

نامه پزشکیان به عارف و انتقاد از منع صادرات محصولات کشاورزی

مربوطه پست ها

نسخه جدید گراک از دموکرات‌ها و مدیران یهودی هالیوود انتقاد کرد
هوش مصنوعی

نسخه جدید گراک از دموکرات‌ها و مدیران یهودی هالیوود انتقاد کرد

۱۷ تیر ۱۴۰۴
مقابله جدی‌تر با دیپ‌فیک‌ها؛ شهروندان دانمارک مالک کپی‌رایت چهره خود می‌شوند
هوش مصنوعی

مقابله جدی‌تر با دیپ‌فیک‌ها؛ شهروندان دانمارک مالک کپی‌رایت چهره خود می‌شوند

۱۷ تیر ۱۴۰۴
اپل مدل هوش مصنوعی متفاوت و جذابی را برای برنامه‌نویسی منتشر کرد
هوش مصنوعی

اپل مدل هوش مصنوعی متفاوت و جذابی را برای برنامه‌نویسی منتشر کرد

۱۵ تیر ۱۴۰۴
محققان:‌ در ۱۴ درصد از مقالات علمی نشانه‌های استفاده از هوش مصنوعی وجود دارد
هوش مصنوعی

محققان:‌ در ۱۴ درصد از مقالات علمی نشانه‌های استفاده از هوش مصنوعی وجود دارد

۱۴ تیر ۱۴۰۴
سیری هوشمند احتمالاً با کمک OpenAI یا آنتروپیک ساخته می‌شود
هوش مصنوعی

سیری هوشمند احتمالاً با کمک OpenAI یا آنتروپیک ساخته می‌شود

۱۰ تیر ۱۴۰۴
مارک زاکربرگ از آزمایشگاه هوش مصنوعی جدید متا رونمایی کرد؛ رقابت جدی‌تر با OpenAI
هوش مصنوعی

مارک زاکربرگ از آزمایشگاه هوش مصنوعی جدید متا رونمایی کرد؛ رقابت جدی‌تر با OpenAI

۱۰ تیر ۱۴۰۴

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

4 × پنج =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • تهیه‌کننده آمریکایی: ترامپ دیکتاتور و نوچه‌هایش را بیرون می‌کنیم
  • ۲۰ سخنرانی عاشورایی در ایران‌صدا؛ «با کاروان محرم» همراه شوید
  • امضای تفاهم‌نامه میان موزه سینما و انجمن صنفی عکاسان سینما
  • ۲۷ تیر آخرین مهلت ثبت‌نام در هجدهمین رویداد موسیقی جوان
  • «قوی‌دل» به اکران آنلاین آمد
  • پاسینیک
  • خرید سرور hp
  • خرید سرور ایران و خارج
  • مانیتور ساینا کوییک
  • خرید یوسی
  • حوله استخری
  • خرید قهوه
  • تجارتخانه آراد برندینگ
  • ویرایش مقاله
  • تابلو لایت باکس
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • قیمت هاست فروشگاهی
  • پرشین هتل
  • خرید لیفتراک دست دوم
  • آموزش علوم اول ابتدایی
  • راحت ترین روش یادگیری انگلیسی

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.