دوشنبه, شهریور ۳, ۱۴۰۴
دانش جوین
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
بدون نتیجه
مشاهده همه نتیجه
  • ورود
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی هوش مصنوعی

امتیاز کم هوش مصنوعی «اوپن‌ای‌آی» در یک آزمایش، سؤال‌برانگیز شد

خبرگزاری ایسنا توسط خبرگزاری ایسنا
۰۱ اردیبهشت ۱۴۰۴
در هوش مصنوعی
زمان خواندن: زمان موردنیاز برای مطالعه: 1 دقیقه
0
A A
امتیاز کم هوش مصنوعی «اوپن‌ای‌آی» در یک آزمایش، سؤال‌برانگیز شد
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

به گزارش ایسنا، اختلاف بین نتایج یک آزمایش جدید با اطلاعات اولیه درباره مدل هوش مصنوعی «o3» شرکت «اوپن‌ای‌آی»(OpenAI)، پرسش‌هایی را درباره شفافیت و شیوه‌های آزمایش مدل هوش مصنوعی این شرکت ایجاد می‌کند.

به نقل از تک کرانچ، وقتی اوپن‌ای‌آی در ماه دسامبر از o3 رونمایی کرد، مدعی شد این مدل می‌تواند به بیش از یک چهارم پرسش‌های «FrontierMath» که مجموعه چالش‌برانگیزی از مسائل ریاضی است، پاسخ دهد. این امتیاز، رقابت را از بین برد؛ زیرا بهترین مدل بعدی تنها توانست به حدود دو درصد از مسائل FrontierMath به درستی پاسخ دهد.

«مارک چن»(Mark Chen)، مدیر ارشد تحقیقات اوپن‌ای‌آی در جریان یک پخش زنده گفت: امروز همه مدل‌ها کمتر از دو درصد امتیاز را در FrontierMath دارند. ما شاهد هستیم که با o3 می‌توانیم به امتیاز بیش از ۲۵ درصد برسیم.

همان طور که مشخص شد، این احتمالا امتیاز بالاتری بود که توسط یک نسخه از o3 با محاسبات بیشتر نسبت به مدل عرضه‌شده اوپن‌ای‌آی در هفته گذشته به دست آمد.

مؤسسه تحقیقاتی «Epoch AI» مسئول FrontierMath، نتایج آزمایش مستقل خود درباره o3 را در روز جمعه منتشر کرد. این مؤسسه دریافت o3 حدود ۱۰ درصد امتیاز کسب کرده که بسیار کمتر از بالاترین امتیاز ادعاشده توسط اوپن‌ای‌آی است.

این بدان معنا نیست که اوپن‌ای‌آی دروغ گفته است. نتایج آزمایشی که این شرکت در ماه دسامبر منتشر کرد، یک امتیاز پایین‌تر را نشان می‌دهد که با امتیاز مشاهده‌شده در آزمایش Epoch AI مطابقت دارد. همچنین، Epoch خاطرنشان کرد که تنظیمات آزمایشی آن احتمالا با اوپن‌ای‌آی تفاوت دارد و از نسخه به‌روزرسانی‌شده FrontierMath برای ارزیابی‌های خود استفاده کرده است.

Epoch نوشت: تفاوت بین نتایج ما و اوپن‌ای‌آی ممکن است به دلیل ارزیابی این شرکت با چارچوب داخلی قوی‌تر و استفاده از زمان آزمایش بیشتر یا به این دلیل باشد که این نتایج در زیرمجموعه دیگری از FrontierMath به دست آمده‌اند.

انتهای پیام

شاید برای شما جالب باشد

چطور دوبله یوتیوب با هوش مصنوعی انجام میشود؟ راهنمای کامل استفاده از ابزارهای AI

اپل احتمالاً سال آینده از سرویس +Health رونمایی می‌کند؛ مربی شخصی هوش مصنوعی

مدیرعامل هوش مصنوعی مایکروسافت درباره خودآگاهی تقلبی هوش مصنوعی هشدار می‌دهد

به گزارش ایسنا، اختلاف بین نتایج یک آزمایش جدید با اطلاعات اولیه درباره مدل هوش مصنوعی «o3» شرکت «اوپن‌ای‌آی»(OpenAI)، پرسش‌هایی را درباره شفافیت و شیوه‌های آزمایش مدل هوش مصنوعی این شرکت ایجاد می‌کند.

به نقل از تک کرانچ، وقتی اوپن‌ای‌آی در ماه دسامبر از o3 رونمایی کرد، مدعی شد این مدل می‌تواند به بیش از یک چهارم پرسش‌های «FrontierMath» که مجموعه چالش‌برانگیزی از مسائل ریاضی است، پاسخ دهد. این امتیاز، رقابت را از بین برد؛ زیرا بهترین مدل بعدی تنها توانست به حدود دو درصد از مسائل FrontierMath به درستی پاسخ دهد.

«مارک چن»(Mark Chen)، مدیر ارشد تحقیقات اوپن‌ای‌آی در جریان یک پخش زنده گفت: امروز همه مدل‌ها کمتر از دو درصد امتیاز را در FrontierMath دارند. ما شاهد هستیم که با o3 می‌توانیم به امتیاز بیش از ۲۵ درصد برسیم.

همان طور که مشخص شد، این احتمالا امتیاز بالاتری بود که توسط یک نسخه از o3 با محاسبات بیشتر نسبت به مدل عرضه‌شده اوپن‌ای‌آی در هفته گذشته به دست آمد.

مؤسسه تحقیقاتی «Epoch AI» مسئول FrontierMath، نتایج آزمایش مستقل خود درباره o3 را در روز جمعه منتشر کرد. این مؤسسه دریافت o3 حدود ۱۰ درصد امتیاز کسب کرده که بسیار کمتر از بالاترین امتیاز ادعاشده توسط اوپن‌ای‌آی است.

این بدان معنا نیست که اوپن‌ای‌آی دروغ گفته است. نتایج آزمایشی که این شرکت در ماه دسامبر منتشر کرد، یک امتیاز پایین‌تر را نشان می‌دهد که با امتیاز مشاهده‌شده در آزمایش Epoch AI مطابقت دارد. همچنین، Epoch خاطرنشان کرد که تنظیمات آزمایشی آن احتمالا با اوپن‌ای‌آی تفاوت دارد و از نسخه به‌روزرسانی‌شده FrontierMath برای ارزیابی‌های خود استفاده کرده است.

Epoch نوشت: تفاوت بین نتایج ما و اوپن‌ای‌آی ممکن است به دلیل ارزیابی این شرکت با چارچوب داخلی قوی‌تر و استفاده از زمان آزمایش بیشتر یا به این دلیل باشد که این نتایج در زیرمجموعه دیگری از FrontierMath به دست آمده‌اند.

انتهای پیام

پست قبلی

بازی تازه در بازار مسکن شروع شد/مستاجران منتظر تغییرات باشند

پست بعدی

نوزدهمین دوره مسابقات ربوکاپ آزاد ایران در قلب تهران/از کد تا عملکرد؛ نمایش قدرت ذهن در ربوکاپ ۱۴۰۴

پست بعدی
نوزدهمین دوره مسابقات ربوکاپ آزاد ایران در قلب تهران/از کد تا عملکرد؛ نمایش قدرت ذهن در ربوکاپ ۱۴۰۴

نوزدهمین دوره مسابقات ربوکاپ آزاد ایران در قلب تهران/از کد تا عملکرد؛ نمایش قدرت ذهن در ربوکاپ ۱۴۰۴

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پنج × دو =

ده + 15 =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • برپایی کنسرت گروه روایت در خانه هنرمندان
  • فصل سوم مجموعه مستند «آئینه عمر» روی آنتن شبکه چهار
  • گلاب آدینه و علی قمصری با «داستان شهریار» به تالار وحدت می‌آیند
  • «راهبرد» نه هیجان‌زده نه منفعل؛ مجری باید متعهد، منصف و تحلیلگر باشد
  • «عشق در انفرادی» مسعود کیمیایی پروانه ساخت گرفت
  • پاسینیک
  • خرید سرور ایران و خارج
  • تجارتخانه آراد برندینگ
  • ویرایش مقاله
  • تابلو لایت باکس
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • پرشین هتل
  • راحت ترین روش یادگیری انگلیسی
  • خرید سرور ابری
  • سنگ قبر
  • خرید کتاب زبا انگلیسی – قیمت کتاب زبان انگلیسی با تخفیف – کتاب آموزشی زبان انگلیسی

تمامی حقوق برای دانش جوین محفوظ بوده و کپی از آن پیگرد قانونی خواهد داشت

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده

تمامی حقوق برای دانش جوین محفوظ بوده و کپی از آن پیگرد قانونی خواهد داشت