دانش جوین
چهارشنبه, مرداد ۱, ۱۴۰۴
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
  • ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی هوش مصنوعی

چالش دیگری برای OpenAI؛ محققان با کمتر از 50 دلار مدل هوش مصنوعی استدلال‌گر رایگان ساخته‌اند

دیجیاتو توسط دیجیاتو
۱۸ بهمن ۱۴۰۳
در هوش مصنوعی
زمان خواندن: زمان موردنیاز برای مطالعه: 2 دقیقه
0
چالش دیگری برای OpenAI؛ محققان با کمتر از 50 دلار مدل هوش مصنوعی استدلال‌گر رایگان ساخته‌اند
2
بازدیدها
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

طی هفته‌های گذشته هوش مصنوعی چینی DeepSeek که با هزینه‌ای بسیار کمتر از مدل‌های آمریکایی ساخته شده باعث سقوط سهام شرکت‌های فناوری و بازارهای جهان شده بود. حالا محققان دانشگاه‌های استنفورد و واشنگتن در مقاله جدیدی ادعا کرده‌اند که با کمتر از 50 دلار موفق به ساخت یک مدل هوش مصنوعی استدلال‌گر رایگان مانند o1 از OpenAI شده‌اند.

طبق گزارش‌های منتشر شده، این مدل که s1 نام دارد در تست‌هایی که توانایی آن در ریاضی و کدنویسی را اندازه‌گیری می‌کنند، مشابه مدل‌های استدلال‌گر پیشرفته مانند o1 و DeepSeek R1 عمل کرده است. هم‌اکنون مدل s1 به همراه داده‌ها و کد مورد استفاده برای آموزش آن در GitHub موجود است.

ساخت مدل هوش مصنوعی رایگان s1

محققان در مقاله خود می‌گویند که ابتدا یک مدل پایه را توسعه داده‌اند و سپس از طریق فرایندی با نام «تقطیر» که برای استخراج قابلیت‌های «استدلال» از یک مدل هوش مصنوعی دیگر کاربرد دارد، آن را تنظیم کرده‌اند. به گفته آنها، برای این فرایند از مدل جمینای 2.0 Flash Thinking Experimental گوگل کمک گرفته شده است.

به گفته محققان، آموزش s1 با 16 پردازنده گرافیکی انویدیا H100 کمتر از 30 دقیقه طول کشیده است و این مدل در برخی از بنچمارک‌های هوش مصنوعی به عملکرد بسیار خوبی دست یافته است.

تیم تحقیقاتی سازنده s1 در توسعه مدل خود به دنبال ساده‌ترین رویکرد برای دستیابی به عملکرد قدرتمند در استدلال و «مقیاس‌بندی زمان آزمون» بوده‌اند که مورد دوم به مدل هوش مصنوعی اجازه می‌دهد تا قبل از ارائه پاسخ بیشتر فکر کند. البته OpenAI نیز در مدل o1 خود به چنین پیشرفت‌هایی دست یافته بود و سپس DeepSeek و دیگر آزمایشگاه‌های هوش مصنوعی نیز سعی کرده‌اند تا آنها را از طریق تکنیک‌های مختلف مورد استفاده قرار دهند.

مقاله s1 نشان می‌دهد که مدل‌های استدلال‌گرا را می‌توان از طریق فرایندی به نام «تنظیم دقیق نظارت‌شده» (SFT) با یک مجموعه داده نسبتاً کوچک تقطیر کرد. در این فرایند به مدل هوش مصنوعی دستور داده می‌شود که رفتارهای خاصی را در یک مجموعه داده شبیه‌سازی کند. گفته می‌شود که فرایند SFT نسبت به روش یادگیری تقویتی که DeepSeek برای آموزش مدل R1 براساس o1 انجام داده، ارزان‌تر است.

طی هفته‌های گذشته هوش مصنوعی چینی DeepSeek که با هزینه‌ای بسیار کمتر از مدل‌های آمریکایی ساخته شده باعث سقوط سهام شرکت‌های فناوری و بازارهای جهان شده بود. حالا محققان دانشگاه‌های استنفورد و واشنگتن در مقاله جدیدی ادعا کرده‌اند که با کمتر از 50 دلار موفق به ساخت یک مدل هوش مصنوعی استدلال‌گر رایگان مانند o1 از OpenAI شده‌اند.

طبق گزارش‌های منتشر شده، این مدل که s1 نام دارد در تست‌هایی که توانایی آن در ریاضی و کدنویسی را اندازه‌گیری می‌کنند، مشابه مدل‌های استدلال‌گر پیشرفته مانند o1 و DeepSeek R1 عمل کرده است. هم‌اکنون مدل s1 به همراه داده‌ها و کد مورد استفاده برای آموزش آن در GitHub موجود است.

ساخت مدل هوش مصنوعی رایگان s1

محققان در مقاله خود می‌گویند که ابتدا یک مدل پایه را توسعه داده‌اند و سپس از طریق فرایندی با نام «تقطیر» که برای استخراج قابلیت‌های «استدلال» از یک مدل هوش مصنوعی دیگر کاربرد دارد، آن را تنظیم کرده‌اند. به گفته آنها، برای این فرایند از مدل جمینای 2.0 Flash Thinking Experimental گوگل کمک گرفته شده است.

به گفته محققان، آموزش s1 با 16 پردازنده گرافیکی انویدیا H100 کمتر از 30 دقیقه طول کشیده است و این مدل در برخی از بنچمارک‌های هوش مصنوعی به عملکرد بسیار خوبی دست یافته است.

تیم تحقیقاتی سازنده s1 در توسعه مدل خود به دنبال ساده‌ترین رویکرد برای دستیابی به عملکرد قدرتمند در استدلال و «مقیاس‌بندی زمان آزمون» بوده‌اند که مورد دوم به مدل هوش مصنوعی اجازه می‌دهد تا قبل از ارائه پاسخ بیشتر فکر کند. البته OpenAI نیز در مدل o1 خود به چنین پیشرفت‌هایی دست یافته بود و سپس DeepSeek و دیگر آزمایشگاه‌های هوش مصنوعی نیز سعی کرده‌اند تا آنها را از طریق تکنیک‌های مختلف مورد استفاده قرار دهند.

مقاله s1 نشان می‌دهد که مدل‌های استدلال‌گرا را می‌توان از طریق فرایندی به نام «تنظیم دقیق نظارت‌شده» (SFT) با یک مجموعه داده نسبتاً کوچک تقطیر کرد. در این فرایند به مدل هوش مصنوعی دستور داده می‌شود که رفتارهای خاصی را در یک مجموعه داده شبیه‌سازی کند. گفته می‌شود که فرایند SFT نسبت به روش یادگیری تقویتی که DeepSeek برای آموزش مدل R1 براساس o1 انجام داده، ارزان‌تر است.

اخبارجدیدترین

گوگل از Gemini Drops رونمایی کرد؛ به‌روزرسانی‌های ماهانه برای هوش مصنوعی

ChatGPT ظاهراً روی تصاویر تولیدشده با هوش مصنوعی واترمارک می‌گذارد

هشدار نایب رئیس کمیسیون هوش مصنوعی نصر تهران: هوش مصنوعی با نگاه امنیتی و دولتی‌سازی توسعه نمی‌یابد

طی هفته‌های گذشته هوش مصنوعی چینی DeepSeek که با هزینه‌ای بسیار کمتر از مدل‌های آمریکایی ساخته شده باعث سقوط سهام شرکت‌های فناوری و بازارهای جهان شده بود. حالا محققان دانشگاه‌های استنفورد و واشنگتن در مقاله جدیدی ادعا کرده‌اند که با کمتر از 50 دلار موفق به ساخت یک مدل هوش مصنوعی استدلال‌گر رایگان مانند o1 از OpenAI شده‌اند.

طبق گزارش‌های منتشر شده، این مدل که s1 نام دارد در تست‌هایی که توانایی آن در ریاضی و کدنویسی را اندازه‌گیری می‌کنند، مشابه مدل‌های استدلال‌گر پیشرفته مانند o1 و DeepSeek R1 عمل کرده است. هم‌اکنون مدل s1 به همراه داده‌ها و کد مورد استفاده برای آموزش آن در GitHub موجود است.

ساخت مدل هوش مصنوعی رایگان s1

محققان در مقاله خود می‌گویند که ابتدا یک مدل پایه را توسعه داده‌اند و سپس از طریق فرایندی با نام «تقطیر» که برای استخراج قابلیت‌های «استدلال» از یک مدل هوش مصنوعی دیگر کاربرد دارد، آن را تنظیم کرده‌اند. به گفته آنها، برای این فرایند از مدل جمینای 2.0 Flash Thinking Experimental گوگل کمک گرفته شده است.

به گفته محققان، آموزش s1 با 16 پردازنده گرافیکی انویدیا H100 کمتر از 30 دقیقه طول کشیده است و این مدل در برخی از بنچمارک‌های هوش مصنوعی به عملکرد بسیار خوبی دست یافته است.

تیم تحقیقاتی سازنده s1 در توسعه مدل خود به دنبال ساده‌ترین رویکرد برای دستیابی به عملکرد قدرتمند در استدلال و «مقیاس‌بندی زمان آزمون» بوده‌اند که مورد دوم به مدل هوش مصنوعی اجازه می‌دهد تا قبل از ارائه پاسخ بیشتر فکر کند. البته OpenAI نیز در مدل o1 خود به چنین پیشرفت‌هایی دست یافته بود و سپس DeepSeek و دیگر آزمایشگاه‌های هوش مصنوعی نیز سعی کرده‌اند تا آنها را از طریق تکنیک‌های مختلف مورد استفاده قرار دهند.

مقاله s1 نشان می‌دهد که مدل‌های استدلال‌گرا را می‌توان از طریق فرایندی به نام «تنظیم دقیق نظارت‌شده» (SFT) با یک مجموعه داده نسبتاً کوچک تقطیر کرد. در این فرایند به مدل هوش مصنوعی دستور داده می‌شود که رفتارهای خاصی را در یک مجموعه داده شبیه‌سازی کند. گفته می‌شود که فرایند SFT نسبت به روش یادگیری تقویتی که DeepSeek برای آموزش مدل R1 براساس o1 انجام داده، ارزان‌تر است.

طی هفته‌های گذشته هوش مصنوعی چینی DeepSeek که با هزینه‌ای بسیار کمتر از مدل‌های آمریکایی ساخته شده باعث سقوط سهام شرکت‌های فناوری و بازارهای جهان شده بود. حالا محققان دانشگاه‌های استنفورد و واشنگتن در مقاله جدیدی ادعا کرده‌اند که با کمتر از 50 دلار موفق به ساخت یک مدل هوش مصنوعی استدلال‌گر رایگان مانند o1 از OpenAI شده‌اند.

طبق گزارش‌های منتشر شده، این مدل که s1 نام دارد در تست‌هایی که توانایی آن در ریاضی و کدنویسی را اندازه‌گیری می‌کنند، مشابه مدل‌های استدلال‌گر پیشرفته مانند o1 و DeepSeek R1 عمل کرده است. هم‌اکنون مدل s1 به همراه داده‌ها و کد مورد استفاده برای آموزش آن در GitHub موجود است.

ساخت مدل هوش مصنوعی رایگان s1

محققان در مقاله خود می‌گویند که ابتدا یک مدل پایه را توسعه داده‌اند و سپس از طریق فرایندی با نام «تقطیر» که برای استخراج قابلیت‌های «استدلال» از یک مدل هوش مصنوعی دیگر کاربرد دارد، آن را تنظیم کرده‌اند. به گفته آنها، برای این فرایند از مدل جمینای 2.0 Flash Thinking Experimental گوگل کمک گرفته شده است.

به گفته محققان، آموزش s1 با 16 پردازنده گرافیکی انویدیا H100 کمتر از 30 دقیقه طول کشیده است و این مدل در برخی از بنچمارک‌های هوش مصنوعی به عملکرد بسیار خوبی دست یافته است.

تیم تحقیقاتی سازنده s1 در توسعه مدل خود به دنبال ساده‌ترین رویکرد برای دستیابی به عملکرد قدرتمند در استدلال و «مقیاس‌بندی زمان آزمون» بوده‌اند که مورد دوم به مدل هوش مصنوعی اجازه می‌دهد تا قبل از ارائه پاسخ بیشتر فکر کند. البته OpenAI نیز در مدل o1 خود به چنین پیشرفت‌هایی دست یافته بود و سپس DeepSeek و دیگر آزمایشگاه‌های هوش مصنوعی نیز سعی کرده‌اند تا آنها را از طریق تکنیک‌های مختلف مورد استفاده قرار دهند.

مقاله s1 نشان می‌دهد که مدل‌های استدلال‌گرا را می‌توان از طریق فرایندی به نام «تنظیم دقیق نظارت‌شده» (SFT) با یک مجموعه داده نسبتاً کوچک تقطیر کرد. در این فرایند به مدل هوش مصنوعی دستور داده می‌شود که رفتارهای خاصی را در یک مجموعه داده شبیه‌سازی کند. گفته می‌شود که فرایند SFT نسبت به روش یادگیری تقویتی که DeepSeek برای آموزش مدل R1 براساس o1 انجام داده، ارزان‌تر است.

پست قبلی

اپل ظاهراً تولید انبوه تراشه‌های M5 را آغاز کرده است

پست بعدی

بازسازی معادن؛ گامی به سوی آینده‌ای سبزتر / چرا بازسازی معادن مهم است؟

مربوطه پست ها

گوگل از Gemini Drops رونمایی کرد؛ به‌روزرسانی‌های ماهانه برای هوش مصنوعی
هوش مصنوعی

گوگل از Gemini Drops رونمایی کرد؛ به‌روزرسانی‌های ماهانه برای هوش مصنوعی

۳۱ تیر ۱۴۰۴
ChatGPT ظاهراً روی تصاویر تولیدشده با هوش مصنوعی واترمارک می‌گذارد
هوش مصنوعی

ChatGPT ظاهراً روی تصاویر تولیدشده با هوش مصنوعی واترمارک می‌گذارد

۳۱ تیر ۱۴۰۴
هشدار نایب رئیس کمیسیون هوش مصنوعی نصر تهران: هوش مصنوعی با نگاه امنیتی و دولتی‌سازی توسعه نمی‌یابد
هوش مصنوعی

هشدار نایب رئیس کمیسیون هوش مصنوعی نصر تهران: هوش مصنوعی با نگاه امنیتی و دولتی‌سازی توسعه نمی‌یابد

۳۱ تیر ۱۴۰۴
مراکز داده هوش مصنوعی متا به منابع آب محلی در آمریکا فشار می‌آورند
هوش مصنوعی

مراکز داده هوش مصنوعی متا به منابع آب محلی در آمریکا فشار می‌آورند

۳۱ تیر ۱۴۰۴
متا دستورالعمل داوطلبانه اتحادیه اروپا در زمینه هوش مصنوعی را نپذیرفت
هوش مصنوعی

متا دستورالعمل داوطلبانه اتحادیه اروپا در زمینه هوش مصنوعی را نپذیرفت

۳۱ تیر ۱۴۰۴
هم‌بنیان‌گذار آنتروپیک می‌گوید پیشنهادهای متا برای جذب اعضای تیم او کافی نبوده است
هوش مصنوعی

هم‌بنیان‌گذار آنتروپیک می‌گوید پیشنهادهای متا برای جذب اعضای تیم او کافی نبوده است

۳۱ تیر ۱۴۰۴

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

10 + 15 =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • بانک مرکزی: ریال دیجیتال وارد فاز اجرایی شد
  • آیا SHIB شیبا اینو می‌تواند پابه‌پای اتریوم صعود کند؟+ نمودار
  • گام بزرگ اتریوم به سوی آینده‌ای مقیاس‌پذیرتر!
  • حباب بیت‌کوین در آستانه ترکیدن/ کیوساکی بهترین زمان برای خرید را فاش کرد!
  • واگذاری مابقی سهام استقلال و پرسپولیس: قیمت‌های جدید اعلام شد
  • پاسینیک
  • خرید سرور ایران و خارج
  • تجارتخانه آراد برندینگ
  • ویرایش مقاله
  • تابلو لایت باکس
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • پرشین هتل
  • راحت ترین روش یادگیری انگلیسی
  • خرید سرور ابری

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.