دانش جوین
جمعه, تیر ۲۷, ۱۴۰۴
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
  • ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی هوش مصنوعی

نتایج درخشان بنچمارک مدل‌های هوش مصنوعی لاما 4 متا زیر سؤال رفت

دیجیاتو توسط دیجیاتو
۱۹ فروردین ۱۴۰۴
در هوش مصنوعی
زمان خواندن: زمان موردنیاز برای مطالعه: 2 دقیقه
1
نتایج درخشان بنچمارک مدل‌های هوش مصنوعی لاما 4 متا زیر سؤال رفت
4
بازدیدها
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

متا اوایل هفته جاری از مدل‌های هوش مصنوعی Llama 4 ازجمله Scout و Maverick رونمایی کرد. نتایج بنچمارک‌های اولیه نشان می‌داد این مدل‌ها قوی‌تر از رقبا هستند اما شاید متا نتایج این بنچمارک‌ها را دستکاری کرده باشد، هرچند خود شرکت این ادعا را رد می‌کند.

به گزارش ورج، مدل Maverick در بنچمارک LMArena توانست نمره ۱۴۱۷ را کسب کند و رقبایی همچون مدل 4o از OpenAI را پشت سر بگذارد و با فاصله بسیار اندکی پشت سر مدل جمینای ۲.۵ پرو قرار بگیرد. این نتایج ابتدا حکایت از آن داشت که متا توانسته رقبای قدرتمندی همچون گوگل و OpenAI را شکست دهد اما متخصصان حوزه هوش مصنوعی ادعاهای متا را بررسی کردند و به نتایج جالبی رسیدند.

شک و تردید درباره نتایج بنچمارک‌های مدل Llama 4 متا

متخصصان ادعا می‌کنند متا مدل‌های Llama 4 را آموزش داده تا در بنچمارک‌ها عملکرد بهتری داشته باشند و درعین‌حال محدودیت‌های واقعی خود را پنهان کنند. بااینکه از همان ابتدا شبهات زیادی درباره عملکرد این مدل‌ها در بنچمارک‌ها و احتمال دستکاری نتایج وجود داشت، «احمد الدحله»، معاون هوش مصنوعی مولد در متا، در پستی در شبکه اجتماعی ایکس تمام این شایعات را تکذیب کرد و گفت چنین چیزی صحت ندارد.

متا اذعان کرده نسخه‌ای از مدل هوش مصنوعی Maverick که در بنچمارک LMArena تست شده، با مدلی که در دسترس عموم قرار گرفته، یکسان نیست. براساس اسناد خود متا، این شرکت نسخه آزمایشی مدل Maverick را در بنچمارک LMArena قرار داده است. این مدل برای مکالمه بهینه‌سازی شده و از ایموجی‌های بیشتری استفاده می‌کند. همچنین این مدل آزمایشی پاسخ‌های طولانی‌تری به سؤالات کاربران می‌دهد.

علاوه‌براین، زمان انتشار مدل‌های جدید هوش مصنوعی متا نیز بر شک متخصصان افزود. متا شنبه، روز اول تعطیلات آخر هفته، از مدل‌های Scout و Maverick رونمایی کرد که برای رونمایی از محصولی جدید با چنین پیشرفت‌های خارق‌العاده‌ بسیار غیرمعمول است.

متا اوایل هفته جاری از مدل‌های هوش مصنوعی Llama 4 ازجمله Scout و Maverick رونمایی کرد. نتایج بنچمارک‌های اولیه نشان می‌داد این مدل‌ها قوی‌تر از رقبا هستند اما شاید متا نتایج این بنچمارک‌ها را دستکاری کرده باشد، هرچند خود شرکت این ادعا را رد می‌کند.

به گزارش ورج، مدل Maverick در بنچمارک LMArena توانست نمره ۱۴۱۷ را کسب کند و رقبایی همچون مدل 4o از OpenAI را پشت سر بگذارد و با فاصله بسیار اندکی پشت سر مدل جمینای ۲.۵ پرو قرار بگیرد. این نتایج ابتدا حکایت از آن داشت که متا توانسته رقبای قدرتمندی همچون گوگل و OpenAI را شکست دهد اما متخصصان حوزه هوش مصنوعی ادعاهای متا را بررسی کردند و به نتایج جالبی رسیدند.

شک و تردید درباره نتایج بنچمارک‌های مدل Llama 4 متا

متخصصان ادعا می‌کنند متا مدل‌های Llama 4 را آموزش داده تا در بنچمارک‌ها عملکرد بهتری داشته باشند و درعین‌حال محدودیت‌های واقعی خود را پنهان کنند. بااینکه از همان ابتدا شبهات زیادی درباره عملکرد این مدل‌ها در بنچمارک‌ها و احتمال دستکاری نتایج وجود داشت، «احمد الدحله»، معاون هوش مصنوعی مولد در متا، در پستی در شبکه اجتماعی ایکس تمام این شایعات را تکذیب کرد و گفت چنین چیزی صحت ندارد.

متا اذعان کرده نسخه‌ای از مدل هوش مصنوعی Maverick که در بنچمارک LMArena تست شده، با مدلی که در دسترس عموم قرار گرفته، یکسان نیست. براساس اسناد خود متا، این شرکت نسخه آزمایشی مدل Maverick را در بنچمارک LMArena قرار داده است. این مدل برای مکالمه بهینه‌سازی شده و از ایموجی‌های بیشتری استفاده می‌کند. همچنین این مدل آزمایشی پاسخ‌های طولانی‌تری به سؤالات کاربران می‌دهد.

علاوه‌براین، زمان انتشار مدل‌های جدید هوش مصنوعی متا نیز بر شک متخصصان افزود. متا شنبه، روز اول تعطیلات آخر هفته، از مدل‌های Scout و Maverick رونمایی کرد که برای رونمایی از محصولی جدید با چنین پیشرفت‌های خارق‌العاده‌ بسیار غیرمعمول است.

اخبارجدیدترین

شرکت OpenAI‌ از ChatGPT Agent برای انجام خودکار کارها رونمایی کرد

انتقاد شدید محققان هوش مصنوعی از فرهنگ کاری xAI: توجهی به مسائل ایمنی نمی‌شود

مدیرعامل انویدیا: هوش مصنوعی همه مشاغل را به‌طور کامل تغییر می‌دهد

متا اوایل هفته جاری از مدل‌های هوش مصنوعی Llama 4 ازجمله Scout و Maverick رونمایی کرد. نتایج بنچمارک‌های اولیه نشان می‌داد این مدل‌ها قوی‌تر از رقبا هستند اما شاید متا نتایج این بنچمارک‌ها را دستکاری کرده باشد، هرچند خود شرکت این ادعا را رد می‌کند.

به گزارش ورج، مدل Maverick در بنچمارک LMArena توانست نمره ۱۴۱۷ را کسب کند و رقبایی همچون مدل 4o از OpenAI را پشت سر بگذارد و با فاصله بسیار اندکی پشت سر مدل جمینای ۲.۵ پرو قرار بگیرد. این نتایج ابتدا حکایت از آن داشت که متا توانسته رقبای قدرتمندی همچون گوگل و OpenAI را شکست دهد اما متخصصان حوزه هوش مصنوعی ادعاهای متا را بررسی کردند و به نتایج جالبی رسیدند.

شک و تردید درباره نتایج بنچمارک‌های مدل Llama 4 متا

متخصصان ادعا می‌کنند متا مدل‌های Llama 4 را آموزش داده تا در بنچمارک‌ها عملکرد بهتری داشته باشند و درعین‌حال محدودیت‌های واقعی خود را پنهان کنند. بااینکه از همان ابتدا شبهات زیادی درباره عملکرد این مدل‌ها در بنچمارک‌ها و احتمال دستکاری نتایج وجود داشت، «احمد الدحله»، معاون هوش مصنوعی مولد در متا، در پستی در شبکه اجتماعی ایکس تمام این شایعات را تکذیب کرد و گفت چنین چیزی صحت ندارد.

متا اذعان کرده نسخه‌ای از مدل هوش مصنوعی Maverick که در بنچمارک LMArena تست شده، با مدلی که در دسترس عموم قرار گرفته، یکسان نیست. براساس اسناد خود متا، این شرکت نسخه آزمایشی مدل Maverick را در بنچمارک LMArena قرار داده است. این مدل برای مکالمه بهینه‌سازی شده و از ایموجی‌های بیشتری استفاده می‌کند. همچنین این مدل آزمایشی پاسخ‌های طولانی‌تری به سؤالات کاربران می‌دهد.

علاوه‌براین، زمان انتشار مدل‌های جدید هوش مصنوعی متا نیز بر شک متخصصان افزود. متا شنبه، روز اول تعطیلات آخر هفته، از مدل‌های Scout و Maverick رونمایی کرد که برای رونمایی از محصولی جدید با چنین پیشرفت‌های خارق‌العاده‌ بسیار غیرمعمول است.

متا اوایل هفته جاری از مدل‌های هوش مصنوعی Llama 4 ازجمله Scout و Maverick رونمایی کرد. نتایج بنچمارک‌های اولیه نشان می‌داد این مدل‌ها قوی‌تر از رقبا هستند اما شاید متا نتایج این بنچمارک‌ها را دستکاری کرده باشد، هرچند خود شرکت این ادعا را رد می‌کند.

به گزارش ورج، مدل Maverick در بنچمارک LMArena توانست نمره ۱۴۱۷ را کسب کند و رقبایی همچون مدل 4o از OpenAI را پشت سر بگذارد و با فاصله بسیار اندکی پشت سر مدل جمینای ۲.۵ پرو قرار بگیرد. این نتایج ابتدا حکایت از آن داشت که متا توانسته رقبای قدرتمندی همچون گوگل و OpenAI را شکست دهد اما متخصصان حوزه هوش مصنوعی ادعاهای متا را بررسی کردند و به نتایج جالبی رسیدند.

شک و تردید درباره نتایج بنچمارک‌های مدل Llama 4 متا

متخصصان ادعا می‌کنند متا مدل‌های Llama 4 را آموزش داده تا در بنچمارک‌ها عملکرد بهتری داشته باشند و درعین‌حال محدودیت‌های واقعی خود را پنهان کنند. بااینکه از همان ابتدا شبهات زیادی درباره عملکرد این مدل‌ها در بنچمارک‌ها و احتمال دستکاری نتایج وجود داشت، «احمد الدحله»، معاون هوش مصنوعی مولد در متا، در پستی در شبکه اجتماعی ایکس تمام این شایعات را تکذیب کرد و گفت چنین چیزی صحت ندارد.

متا اذعان کرده نسخه‌ای از مدل هوش مصنوعی Maverick که در بنچمارک LMArena تست شده، با مدلی که در دسترس عموم قرار گرفته، یکسان نیست. براساس اسناد خود متا، این شرکت نسخه آزمایشی مدل Maverick را در بنچمارک LMArena قرار داده است. این مدل برای مکالمه بهینه‌سازی شده و از ایموجی‌های بیشتری استفاده می‌کند. همچنین این مدل آزمایشی پاسخ‌های طولانی‌تری به سؤالات کاربران می‌دهد.

علاوه‌براین، زمان انتشار مدل‌های جدید هوش مصنوعی متا نیز بر شک متخصصان افزود. متا شنبه، روز اول تعطیلات آخر هفته، از مدل‌های Scout و Maverick رونمایی کرد که برای رونمایی از محصولی جدید با چنین پیشرفت‌های خارق‌العاده‌ بسیار غیرمعمول است.

پست قبلی

IBM کامپیوتر جدیدی برای عصر پردازش‌های هوش مصنوعی معرفی کرد

پست بعدی

این ۵ گوشی محبوب سامسونگ به آخر خط رسیدند

مربوطه پست ها

شرکت OpenAI‌ از ChatGPT Agent برای انجام خودکار کارها رونمایی کرد
هوش مصنوعی

شرکت OpenAI‌ از ChatGPT Agent برای انجام خودکار کارها رونمایی کرد

۲۶ تیر ۱۴۰۴
انتقاد شدید محققان هوش مصنوعی از فرهنگ کاری xAI: توجهی به مسائل ایمنی نمی‌شود
هوش مصنوعی

انتقاد شدید محققان هوش مصنوعی از فرهنگ کاری xAI: توجهی به مسائل ایمنی نمی‌شود

۲۶ تیر ۱۴۰۴
مدیرعامل انویدیا: هوش مصنوعی همه مشاغل را به‌طور کامل تغییر می‌دهد
هوش مصنوعی

مدیرعامل انویدیا: هوش مصنوعی همه مشاغل را به‌طور کامل تغییر می‌دهد

۲۵ تیر ۱۴۰۴
چت‌بات هوش مصنوعی Claude به‌صورت رسمی با Canva یکپارچه شد
هوش مصنوعی

چت‌بات هوش مصنوعی Claude به‌صورت رسمی با Canva یکپارچه شد

۲۵ تیر ۱۴۰۴
گوگل قراردادی ۳ میلیارد دلاری برای خرید انرژی برق‌آبی امضا کرد
هوش مصنوعی

گوگل قراردادی ۳ میلیارد دلاری برای خرید انرژی برق‌آبی امضا کرد

۲۵ تیر ۱۴۰۴
هوش مصنوعی کوپایلوت در ویندوز حالا می‌تواند تمام صفحه‌نمایش شما را ببیند
هوش مصنوعی

هوش مصنوعی کوپایلوت در ویندوز حالا می‌تواند تمام صفحه‌نمایش شما را ببیند

۲۵ تیر ۱۴۰۴

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

9 − هفت =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • نقاشی‌ها تحت تاثیر جنگ؛ از گرنیکای پیکاسو و چهره جنگ دالی تا فتح تهران
  • نمادی از صلح، تاب‌آوری و دوستی ملل در «گل‌ها و نمادهای ملی جهان»
  • رئیس سازمان سینمایی: هنرمندان ما دشمن را ناامید کردند
  • کدام گوشی هوشمند در چین پرفروش‌ترین است؟
  • کاهش ۳۳ درصدی آلاینده‌ها با روانکار نانویی
  • پاسینیک
  • خرید سرور ایران و خارج
  • تجارتخانه آراد برندینگ
  • ویرایش مقاله
  • تابلو لایت باکس
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • پرشین هتل
  • راحت ترین روش یادگیری انگلیسی
  • خرید سرور ابری

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.