دانش جوین
شنبه, تیر ۲۱, ۱۴۰۴
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
  • ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی سایر اخبار تکنولوژی

محققان: بنچمارک‌های مربوط به هوش مصنوعی می‌توانند گمراه‌کننده باشند

کارشناس روابط عمومی دیجیتال توسط کارشناس روابط عمومی دیجیتال
۰۴ مهر ۱۴۰۳
در سایر اخبار تکنولوژی
زمان خواندن: زمان موردنیاز برای مطالعه: 2 دقیقه
0
محققان: بنچمارک‌های مربوط به هوش مصنوعی می‌توانند گمراه‌کننده باشند
1
بازدیدها
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

پژوهش جدید محققان دانشگاه پرینستون نقص‌های متعددی را در بنچمارک‌های هوش مصنوعی و شیوه‌های ارزیابی آن‌ها نشان داده است که مانع می‌شود در بررسی برنامه‌های کاربردی در دنیای واقعی مفید باشند. محققان تأکید دارند که این بنچمارک‌ها نسبت هزینه پاسخ‌دادن مدل هوش مصنوعی به دقت آن را در نظر نمی‌گیرند.

براساس گزارش VentureBeat، سنجش مدل‌های مختلف هوش مصنوعی با بنچمارک‌های ثابت نمی‌تواند نتایج صحیحی در دنیای واقعی ارائه دهد. یکی از مسائل مهمی که محققان در پژوهش خود بر آن تأکید می‌کنند، درنظرنگرفتن شیوه کنترل هزینه در مدل‌های هوش مصنوعی مختلف است.

به‌طورکلی محققان هشدار می‌دهند که این خطاها باعث می‌شود دقت هوش مصنوعی غلط تخمین زده شود و درباره قابلیت‌های هوش مصنوعی خوش‌بینی بیش‌ازحد باشد.

بنچمارک‌های گمراه‌کننده در ارزیابی هوش مصنوعی

برای افزایش دقت، برخی سیستم‌های هوش مصنوعی چندین پاسخ تولید می‌کنند و از مکانیسم‌هایی مختلفی برای انتخاب بهترین پاسخ بهره می‌برند. گاهی نمونه‌برداری از صدها یا هزاران پاسخ می‌تواند دقت هوش مصنوعی را افزایش دهد. درحالی‌که این رویکرد می‌تواند عملکرد را بهبود بخشد، هزینه محاسباتی قابل‌توجهی دارد. این هزینه‌ها در موارد تحقیقاتی که هدف به حداکثررساندن دقت است، مشکل‌ساز نیست.

البته در کاربردهای عمومی، بودجه هر درخواست محدودیتی ندارد. البته ممکن است در برخی موارد برای بالابردن رتبه‌بندی هوش مصنوعی خاصی، از مکانیسم‌های پرهزینه هوش مصنوعی برای افزایش دقت استفاده شود.

بنچمارک و هوش مصنوعی

محققان می‌گویند باید بین ارزیابی مدل‌ها با اهداف تحقیقاتی و مدل‌های کاربردی عمومی تفاوت قایل شد. در تحقیقات، دقت اهمیت دارد و هزینه‌های هوش مصنوعی تا حد زیادی نادیده گرفته می‌شود. بااین‌حال، هنگام توسعه برنامه‌های کاربردی در دنیای واقعی، هزینه‌ها نقش مهمی در شیوه پاسخ‌دهی مدل هوش مصنوعی ایفا می‌کند.

برای نمونه، محققان مطالعه‌ای موردی روی بنچمارک NovelQA (معیاری برای پاسخگویی به سؤالات در متون بسیار طولانی) انجام دادند. آن‌ها دریافتند ممکن است این معیار در ارزیابی مدل‌های کاربردی عمومی گمراه‌کننده باشد.

از سویی، در یادگیری تسک‌های جدید، مدل‌های یادگیری ماشینی اغلب میانبرهایی پیدا می‌کنند که به آن‌ها اجازه می‌دهد در بنچمارک‌ها امتیاز خوبی کسب کنند. به‌عبارتی، این مدل‌ها راه‌هایی برای تقلب در آزمون‌های بنچمارک پیدا می‌کند و نتایجی ارائه می‌دهد که در دنیای واقعی صحیح نیست.

پژوهش جدید محققان دانشگاه پرینستون نقص‌های متعددی را در بنچمارک‌های هوش مصنوعی و شیوه‌های ارزیابی آن‌ها نشان داده است که مانع می‌شود در بررسی برنامه‌های کاربردی در دنیای واقعی مفید باشند. محققان تأکید دارند که این بنچمارک‌ها نسبت هزینه پاسخ‌دادن مدل هوش مصنوعی به دقت آن را در نظر نمی‌گیرند.

براساس گزارش VentureBeat، سنجش مدل‌های مختلف هوش مصنوعی با بنچمارک‌های ثابت نمی‌تواند نتایج صحیحی در دنیای واقعی ارائه دهد. یکی از مسائل مهمی که محققان در پژوهش خود بر آن تأکید می‌کنند، درنظرنگرفتن شیوه کنترل هزینه در مدل‌های هوش مصنوعی مختلف است.

به‌طورکلی محققان هشدار می‌دهند که این خطاها باعث می‌شود دقت هوش مصنوعی غلط تخمین زده شود و درباره قابلیت‌های هوش مصنوعی خوش‌بینی بیش‌ازحد باشد.

بنچمارک‌های گمراه‌کننده در ارزیابی هوش مصنوعی

برای افزایش دقت، برخی سیستم‌های هوش مصنوعی چندین پاسخ تولید می‌کنند و از مکانیسم‌هایی مختلفی برای انتخاب بهترین پاسخ بهره می‌برند. گاهی نمونه‌برداری از صدها یا هزاران پاسخ می‌تواند دقت هوش مصنوعی را افزایش دهد. درحالی‌که این رویکرد می‌تواند عملکرد را بهبود بخشد، هزینه محاسباتی قابل‌توجهی دارد. این هزینه‌ها در موارد تحقیقاتی که هدف به حداکثررساندن دقت است، مشکل‌ساز نیست.

البته در کاربردهای عمومی، بودجه هر درخواست محدودیتی ندارد. البته ممکن است در برخی موارد برای بالابردن رتبه‌بندی هوش مصنوعی خاصی، از مکانیسم‌های پرهزینه هوش مصنوعی برای افزایش دقت استفاده شود.

بنچمارک و هوش مصنوعی

محققان می‌گویند باید بین ارزیابی مدل‌ها با اهداف تحقیقاتی و مدل‌های کاربردی عمومی تفاوت قایل شد. در تحقیقات، دقت اهمیت دارد و هزینه‌های هوش مصنوعی تا حد زیادی نادیده گرفته می‌شود. بااین‌حال، هنگام توسعه برنامه‌های کاربردی در دنیای واقعی، هزینه‌ها نقش مهمی در شیوه پاسخ‌دهی مدل هوش مصنوعی ایفا می‌کند.

برای نمونه، محققان مطالعه‌ای موردی روی بنچمارک NovelQA (معیاری برای پاسخگویی به سؤالات در متون بسیار طولانی) انجام دادند. آن‌ها دریافتند ممکن است این معیار در ارزیابی مدل‌های کاربردی عمومی گمراه‌کننده باشد.

از سویی، در یادگیری تسک‌های جدید، مدل‌های یادگیری ماشینی اغلب میانبرهایی پیدا می‌کنند که به آن‌ها اجازه می‌دهد در بنچمارک‌ها امتیاز خوبی کسب کنند. به‌عبارتی، این مدل‌ها راه‌هایی برای تقلب در آزمون‌های بنچمارک پیدا می‌کند و نتایجی ارائه می‌دهد که در دنیای واقعی صحیح نیست.

اخبارجدیدترین

ستار هاشمی: «پیام» باید الگوی ملی شود / «ایران دیجیتال»، ستون‌ تحول دیجیتال در کشور

باخت خریداران زد فولد ۷/ آیا سامسونگ عمداً باتری فولد ۷ را قربانی طراحی کرده؟

کدام قابلیت‌های هوش مصنوعی سامسونگ تا ابد رایگان می‌مانند؟

پژوهش جدید محققان دانشگاه پرینستون نقص‌های متعددی را در بنچمارک‌های هوش مصنوعی و شیوه‌های ارزیابی آن‌ها نشان داده است که مانع می‌شود در بررسی برنامه‌های کاربردی در دنیای واقعی مفید باشند. محققان تأکید دارند که این بنچمارک‌ها نسبت هزینه پاسخ‌دادن مدل هوش مصنوعی به دقت آن را در نظر نمی‌گیرند.

براساس گزارش VentureBeat، سنجش مدل‌های مختلف هوش مصنوعی با بنچمارک‌های ثابت نمی‌تواند نتایج صحیحی در دنیای واقعی ارائه دهد. یکی از مسائل مهمی که محققان در پژوهش خود بر آن تأکید می‌کنند، درنظرنگرفتن شیوه کنترل هزینه در مدل‌های هوش مصنوعی مختلف است.

به‌طورکلی محققان هشدار می‌دهند که این خطاها باعث می‌شود دقت هوش مصنوعی غلط تخمین زده شود و درباره قابلیت‌های هوش مصنوعی خوش‌بینی بیش‌ازحد باشد.

بنچمارک‌های گمراه‌کننده در ارزیابی هوش مصنوعی

برای افزایش دقت، برخی سیستم‌های هوش مصنوعی چندین پاسخ تولید می‌کنند و از مکانیسم‌هایی مختلفی برای انتخاب بهترین پاسخ بهره می‌برند. گاهی نمونه‌برداری از صدها یا هزاران پاسخ می‌تواند دقت هوش مصنوعی را افزایش دهد. درحالی‌که این رویکرد می‌تواند عملکرد را بهبود بخشد، هزینه محاسباتی قابل‌توجهی دارد. این هزینه‌ها در موارد تحقیقاتی که هدف به حداکثررساندن دقت است، مشکل‌ساز نیست.

البته در کاربردهای عمومی، بودجه هر درخواست محدودیتی ندارد. البته ممکن است در برخی موارد برای بالابردن رتبه‌بندی هوش مصنوعی خاصی، از مکانیسم‌های پرهزینه هوش مصنوعی برای افزایش دقت استفاده شود.

بنچمارک و هوش مصنوعی

محققان می‌گویند باید بین ارزیابی مدل‌ها با اهداف تحقیقاتی و مدل‌های کاربردی عمومی تفاوت قایل شد. در تحقیقات، دقت اهمیت دارد و هزینه‌های هوش مصنوعی تا حد زیادی نادیده گرفته می‌شود. بااین‌حال، هنگام توسعه برنامه‌های کاربردی در دنیای واقعی، هزینه‌ها نقش مهمی در شیوه پاسخ‌دهی مدل هوش مصنوعی ایفا می‌کند.

برای نمونه، محققان مطالعه‌ای موردی روی بنچمارک NovelQA (معیاری برای پاسخگویی به سؤالات در متون بسیار طولانی) انجام دادند. آن‌ها دریافتند ممکن است این معیار در ارزیابی مدل‌های کاربردی عمومی گمراه‌کننده باشد.

از سویی، در یادگیری تسک‌های جدید، مدل‌های یادگیری ماشینی اغلب میانبرهایی پیدا می‌کنند که به آن‌ها اجازه می‌دهد در بنچمارک‌ها امتیاز خوبی کسب کنند. به‌عبارتی، این مدل‌ها راه‌هایی برای تقلب در آزمون‌های بنچمارک پیدا می‌کند و نتایجی ارائه می‌دهد که در دنیای واقعی صحیح نیست.

پژوهش جدید محققان دانشگاه پرینستون نقص‌های متعددی را در بنچمارک‌های هوش مصنوعی و شیوه‌های ارزیابی آن‌ها نشان داده است که مانع می‌شود در بررسی برنامه‌های کاربردی در دنیای واقعی مفید باشند. محققان تأکید دارند که این بنچمارک‌ها نسبت هزینه پاسخ‌دادن مدل هوش مصنوعی به دقت آن را در نظر نمی‌گیرند.

براساس گزارش VentureBeat، سنجش مدل‌های مختلف هوش مصنوعی با بنچمارک‌های ثابت نمی‌تواند نتایج صحیحی در دنیای واقعی ارائه دهد. یکی از مسائل مهمی که محققان در پژوهش خود بر آن تأکید می‌کنند، درنظرنگرفتن شیوه کنترل هزینه در مدل‌های هوش مصنوعی مختلف است.

به‌طورکلی محققان هشدار می‌دهند که این خطاها باعث می‌شود دقت هوش مصنوعی غلط تخمین زده شود و درباره قابلیت‌های هوش مصنوعی خوش‌بینی بیش‌ازحد باشد.

بنچمارک‌های گمراه‌کننده در ارزیابی هوش مصنوعی

برای افزایش دقت، برخی سیستم‌های هوش مصنوعی چندین پاسخ تولید می‌کنند و از مکانیسم‌هایی مختلفی برای انتخاب بهترین پاسخ بهره می‌برند. گاهی نمونه‌برداری از صدها یا هزاران پاسخ می‌تواند دقت هوش مصنوعی را افزایش دهد. درحالی‌که این رویکرد می‌تواند عملکرد را بهبود بخشد، هزینه محاسباتی قابل‌توجهی دارد. این هزینه‌ها در موارد تحقیقاتی که هدف به حداکثررساندن دقت است، مشکل‌ساز نیست.

البته در کاربردهای عمومی، بودجه هر درخواست محدودیتی ندارد. البته ممکن است در برخی موارد برای بالابردن رتبه‌بندی هوش مصنوعی خاصی، از مکانیسم‌های پرهزینه هوش مصنوعی برای افزایش دقت استفاده شود.

بنچمارک و هوش مصنوعی

محققان می‌گویند باید بین ارزیابی مدل‌ها با اهداف تحقیقاتی و مدل‌های کاربردی عمومی تفاوت قایل شد. در تحقیقات، دقت اهمیت دارد و هزینه‌های هوش مصنوعی تا حد زیادی نادیده گرفته می‌شود. بااین‌حال، هنگام توسعه برنامه‌های کاربردی در دنیای واقعی، هزینه‌ها نقش مهمی در شیوه پاسخ‌دهی مدل هوش مصنوعی ایفا می‌کند.

برای نمونه، محققان مطالعه‌ای موردی روی بنچمارک NovelQA (معیاری برای پاسخگویی به سؤالات در متون بسیار طولانی) انجام دادند. آن‌ها دریافتند ممکن است این معیار در ارزیابی مدل‌های کاربردی عمومی گمراه‌کننده باشد.

از سویی، در یادگیری تسک‌های جدید، مدل‌های یادگیری ماشینی اغلب میانبرهایی پیدا می‌کنند که به آن‌ها اجازه می‌دهد در بنچمارک‌ها امتیاز خوبی کسب کنند. به‌عبارتی، این مدل‌ها راه‌هایی برای تقلب در آزمون‌های بنچمارک پیدا می‌کند و نتایجی ارائه می‌دهد که در دنیای واقعی صحیح نیست.

پست قبلی

برزیل استفاده متا از داده‌های کاربران برای آموزش هوش مصنوعی را ممنوع کرد

پست بعدی

نسخه نهایی سیری جدید با Apple Intelligence احتمالاً در بهار 2025 عرضه می‌شود

مربوطه پست ها

ستار هاشمی: «پیام» باید الگوی ملی شود / «ایران دیجیتال»، ستون‌ تحول دیجیتال در کشور
سایر اخبار تکنولوژی

ستار هاشمی: «پیام» باید الگوی ملی شود / «ایران دیجیتال»، ستون‌ تحول دیجیتال در کشور

۲۰ تیر ۱۴۰۴
باخت خریداران زد فولد ۷/ آیا سامسونگ عمداً باتری فولد ۷ را قربانی طراحی کرده؟
سایر اخبار تکنولوژی

باخت خریداران زد فولد ۷/ آیا سامسونگ عمداً باتری فولد ۷ را قربانی طراحی کرده؟

۲۰ تیر ۱۴۰۴
کدام قابلیت‌های هوش مصنوعی سامسونگ تا ابد رایگان می‌مانند؟
سایر اخبار تکنولوژی

کدام قابلیت‌های هوش مصنوعی سامسونگ تا ابد رایگان می‌مانند؟

۲۰ تیر ۱۴۰۴
چطور باج‌افزار، رمز ارز و فیشینگ باعث ضررهای میلیارد دلاری شدند؟
سایر اخبار تکنولوژی

چطور باج‌افزار، رمز ارز و فیشینگ باعث ضررهای میلیارد دلاری شدند؟

۲۰ تیر ۱۴۰۴
رکوردشکنی در قطر / ساخت مدرسه با چاپگر سه‌بعدی !
سایر اخبار تکنولوژی

رکوردشکنی در قطر / ساخت مدرسه با چاپگر سه‌بعدی !

۲۰ تیر ۱۴۰۴
مشکل عجیب گوشی‌های سونی / فروش این گوشی در ژاپن متوقف شد
سایر اخبار تکنولوژی

مشکل عجیب گوشی‌های سونی / فروش این گوشی در ژاپن متوقف شد

۲۰ تیر ۱۴۰۴

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

19 + سیزده =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • از انقراض تا احیا؛ مستندی که سرگذشت گورخر ایرانی را روایت می‌کند
  • نگاهی به تبلیغات مجازی؛ تئاتر ایران در دوراهی جذب یا فریب مخاطب است؟!
  • آیین یادبود شهدای رسانه ملی برگزار می‌شود
  • پرونده ویژه درباره «غرور ملی» در «هفت»؛ «صددام» نقد می‌شود
  • تاثیر انفجار بر استودیو انیمیشن‌سازی؛ شیشه‌ها فرو ریخت اما کار ترک نشد
  • پاسینیک
  • خرید سرور hp
  • خرید سرور ایران و خارج
  • مانیتور ساینا کوییک
  • خرید یوسی
  • حوله استخری
  • خرید قهوه
  • تجارتخانه آراد برندینگ
  • ویرایش مقاله
  • تابلو لایت باکس
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • قیمت هاست فروشگاهی
  • پرشین هتل
  • خرید لیفتراک دست دوم
  • آموزش علوم اول ابتدایی
  • راحت ترین روش یادگیری انگلیسی

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.