دوشنبه, شهریور ۳, ۱۴۰۴
دانش جوین
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
بدون نتیجه
مشاهده همه نتیجه
  • ورود
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی هوش مصنوعی

«علی‌بابا» از خانواده هوش مصنوعی استدلالی خود رونمایی کرد

خبرگزاری ایسنا توسط خبرگزاری ایسنا
۰۹ اردیبهشت ۱۴۰۴
در هوش مصنوعی
زمان خواندن: زمان موردنیاز برای مطالعه: 1 دقیقه
1
A A
«علی‌بابا» از خانواده هوش مصنوعی استدلالی خود رونمایی کرد
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

به گزارش ایسنا، بیشتر مدل‌ها تحت مجوز پلتفرم توسعه هوش مصنوعی «هاگینگ فیس»(Hugging Face) و «گیت‌هاب»(GitHub) برای دانلود در دسترس هستند یا به زودی در دسترس خواهند بود. اندازه آنها از ۰.۶ میلیارد پارامتر تا ۲۳۵ میلیارد پارامتر متغیر است. پارامترها تقریبا با مهارت‌های حل مسئله یک مدل مطابقت دارند و مدل‌های دارای پارامترهای بیشتر معمولا عملکرد بهتری نسبت به مدل‌هایی با پارامترهای کمتر دارند.

به نقل از تک کرانچ، ظهور مدل‌های چینی مانند «کوئن»(Qwen) شرکت «علی‌بابا»(Alibaba)، فشار را روی شرکت‌های آمریکایی مانند «اوپن‌ای‌آی»(OpenAI) برای ارائه فناوری‌های توانمندتر هوش مصنوعی افزایش داده است. این امر سیاست‌گذاران را نیز به سوی اعمال محدودیت‌هایی با هدف محدود کردن توانایی شرکت‌های هوش مصنوعی چین در دستیابی به تراشه‌های لازم برای آموزش مدل‌ها سوق داده است.

به گفته‌ علی‌بابا، مدل‌های کوئن ۳ مدل‌های ترکیبی هستند؛ به این معنا که می‌توانند با صرف زمان و استدلال از پس مسائل پیچیده برآیند یا به درخواست‌های ساده‌تر به سرعت پاسخ دهند. استدلال، مدل‌ها را قادر می‌سازد تا به طور مؤثر خودشان را بررسی کنند که کار مشابه مدل‌هایی مانند «o3» شرکت اوپن‌ای‌آی اما با تاخیر بیشتر است.

گروه سازنده کوئن در یک پست وبلاگ نوشتند: ما حالت‌های تفکر و عدم تفکر را به طور یکپارچه ادغام کرده‌ایم و انعطاف‌پذیری لازم را برای کنترل تفکر به کاربران ارائه می‌دهیم. این طراحی به کاربران امکان می‌دهد تا قدرت تفکر را با سهولت بیشتری به کار بگیرند. برخی از مدل‌ها نیز روش یادگیری ماشینی «ترکیبی از متخصصان»(MoE) را در پیش می‌گیرند که می‌تواند برای پاسخ دادن به پرسش‌ها از نظر محاسباتی کارآمدتر باشد. روش ترکیبی از متخصصان، وظایف را به زیرمجموعه‌هایی تقسیم می‌کند و آنها را به مدل‌های کوچک‌تر و تخصصی‌تر واگذار می‌کند.

به گفته علی‌بابا، مدل‌های کوئن ۳ از ۱۱۹ زبان پشتیبانی می‌کنند و روی یک مجموعه داده‌ متشکل از حدود ۳۶ تریلیون توکن آموزش دیده‌اند. توکن‌ها بیت‌های خام داده‌ هستند که توسط یک مدل پردازش می‌شوند. یک میلیون توکن معادل حدود ۷۵۰ هزار کلمه است. علی‌بابا می‌گوید که کوئن ۳ روی ترکیبی از کتاب‌های درسی، جفت‌های پرسش-پاسخ، کدها، داده‌های تولیدشده توسط هوش مصنوعی و موارد دیگر آموزش دیده است.

علی‌بابا می‌گوید این پیشرفت‌ همراه با سایر پیشرفت‌ها، قابلیت‌های کوئن ۳ را در مقایسه با کوئن ۲ مدل پیشین آن به میزان قابل توجهی افزایش داده‌ است. هیچ کدام از مدل‌های کوئن ۳ از مدل‌های برتر اخیر مانند o3 و o4-mini شرکت اوپن‌ای‌آی بالاتر نیستند، اما عملکرد قوی دارند.

در «Codeforces» که پلتفرمی برای مسابقات برنامه‌نویسی است، بزرگترین مدل کوئن ۳ موسوم به «Qwen-3-235B-A22B» به راحتی مدل‌های o۳-mini شرکت اوپن‌ای‌آی و «جمینای ۲.۵ پرو»(Gemini 2.5 Pro) گوگل را شکست داد. همچنین، Qwen-3-235B-A22B در جدیدترین نسخه «AIME» که یک معیار ریاضی چالش‌برانگیز است و «BFCL» که آزمایشی برای ارزیابی توانایی یک مدل در استدلال مسائل است، از o3-mini پیشی گرفت.

مدل Qwen-3-235B-A22B هنوز به صورت عمومی در دسترس نیست.

انتهای پیام

شاید برای شما جالب باشد

مدیرعامل هوش مصنوعی مایکروسافت درباره خودآگاهی تقلبی هوش مصنوعی هشدار می‌دهد

گوگل برای اولین‌بار میزان مصرف انرژی جمینای برای یک پرامپت را اعلام کرد

اپل شاید در نسخه جدید سیری از هوش مصنوعی جمینای استفاده کند

به گزارش ایسنا، بیشتر مدل‌ها تحت مجوز پلتفرم توسعه هوش مصنوعی «هاگینگ فیس»(Hugging Face) و «گیت‌هاب»(GitHub) برای دانلود در دسترس هستند یا به زودی در دسترس خواهند بود. اندازه آنها از ۰.۶ میلیارد پارامتر تا ۲۳۵ میلیارد پارامتر متغیر است. پارامترها تقریبا با مهارت‌های حل مسئله یک مدل مطابقت دارند و مدل‌های دارای پارامترهای بیشتر معمولا عملکرد بهتری نسبت به مدل‌هایی با پارامترهای کمتر دارند.

به نقل از تک کرانچ، ظهور مدل‌های چینی مانند «کوئن»(Qwen) شرکت «علی‌بابا»(Alibaba)، فشار را روی شرکت‌های آمریکایی مانند «اوپن‌ای‌آی»(OpenAI) برای ارائه فناوری‌های توانمندتر هوش مصنوعی افزایش داده است. این امر سیاست‌گذاران را نیز به سوی اعمال محدودیت‌هایی با هدف محدود کردن توانایی شرکت‌های هوش مصنوعی چین در دستیابی به تراشه‌های لازم برای آموزش مدل‌ها سوق داده است.

به گفته‌ علی‌بابا، مدل‌های کوئن ۳ مدل‌های ترکیبی هستند؛ به این معنا که می‌توانند با صرف زمان و استدلال از پس مسائل پیچیده برآیند یا به درخواست‌های ساده‌تر به سرعت پاسخ دهند. استدلال، مدل‌ها را قادر می‌سازد تا به طور مؤثر خودشان را بررسی کنند که کار مشابه مدل‌هایی مانند «o3» شرکت اوپن‌ای‌آی اما با تاخیر بیشتر است.

گروه سازنده کوئن در یک پست وبلاگ نوشتند: ما حالت‌های تفکر و عدم تفکر را به طور یکپارچه ادغام کرده‌ایم و انعطاف‌پذیری لازم را برای کنترل تفکر به کاربران ارائه می‌دهیم. این طراحی به کاربران امکان می‌دهد تا قدرت تفکر را با سهولت بیشتری به کار بگیرند. برخی از مدل‌ها نیز روش یادگیری ماشینی «ترکیبی از متخصصان»(MoE) را در پیش می‌گیرند که می‌تواند برای پاسخ دادن به پرسش‌ها از نظر محاسباتی کارآمدتر باشد. روش ترکیبی از متخصصان، وظایف را به زیرمجموعه‌هایی تقسیم می‌کند و آنها را به مدل‌های کوچک‌تر و تخصصی‌تر واگذار می‌کند.

به گفته علی‌بابا، مدل‌های کوئن ۳ از ۱۱۹ زبان پشتیبانی می‌کنند و روی یک مجموعه داده‌ متشکل از حدود ۳۶ تریلیون توکن آموزش دیده‌اند. توکن‌ها بیت‌های خام داده‌ هستند که توسط یک مدل پردازش می‌شوند. یک میلیون توکن معادل حدود ۷۵۰ هزار کلمه است. علی‌بابا می‌گوید که کوئن ۳ روی ترکیبی از کتاب‌های درسی، جفت‌های پرسش-پاسخ، کدها، داده‌های تولیدشده توسط هوش مصنوعی و موارد دیگر آموزش دیده است.

علی‌بابا می‌گوید این پیشرفت‌ همراه با سایر پیشرفت‌ها، قابلیت‌های کوئن ۳ را در مقایسه با کوئن ۲ مدل پیشین آن به میزان قابل توجهی افزایش داده‌ است. هیچ کدام از مدل‌های کوئن ۳ از مدل‌های برتر اخیر مانند o3 و o4-mini شرکت اوپن‌ای‌آی بالاتر نیستند، اما عملکرد قوی دارند.

در «Codeforces» که پلتفرمی برای مسابقات برنامه‌نویسی است، بزرگترین مدل کوئن ۳ موسوم به «Qwen-3-235B-A22B» به راحتی مدل‌های o۳-mini شرکت اوپن‌ای‌آی و «جمینای ۲.۵ پرو»(Gemini 2.5 Pro) گوگل را شکست داد. همچنین، Qwen-3-235B-A22B در جدیدترین نسخه «AIME» که یک معیار ریاضی چالش‌برانگیز است و «BFCL» که آزمایشی برای ارزیابی توانایی یک مدل در استدلال مسائل است، از o3-mini پیشی گرفت.

مدل Qwen-3-235B-A22B هنوز به صورت عمومی در دسترس نیست.

انتهای پیام

پست قبلی

پیش‌بینی بازگشت تومور مغزی در کودکان با هوش مصنوعی

پست بعدی

«چت‌جی‌پی‌تی» به ویژگی جست‌وجو برای خرید آنلاین مجهز می‌شود

پست بعدی
«چت‌جی‌پی‌تی» به ویژگی جست‌وجو برای خرید آنلاین مجهز می‌شود

«چت‌جی‌پی‌تی» به ویژگی جست‌وجو برای خرید آنلاین مجهز می‌شود

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

سه × سه =

4 × یک =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • کدام مود کالاف دیوتی موبایل بهتر است؟
  • 7 ترفند کاربردی برای رزرو بلیط قطار در پیش فروش‌ها و کمبود
  • سکوت سیاست‌گذار در برابر افزایش قیمت بی‌سابقه گوشت
  • پرسودترین و پرضررترین رمزارزهای امروز دوشنبه ۳ شهریور ۱۴۰۴
  • سقوط ناگهانی بیت‌کوین/ شروع بازار خرسی یا توقف موقت؟
  • پاسینیک
  • خرید سرور ایران و خارج
  • تجارتخانه آراد برندینگ
  • ویرایش مقاله
  • تابلو لایت باکس
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • پرشین هتل
  • راحت ترین روش یادگیری انگلیسی
  • خرید سرور ابری
  • سنگ قبر
  • خرید کتاب زبا انگلیسی – قیمت کتاب زبان انگلیسی با تخفیف – کتاب آموزشی زبان انگلیسی

تمامی حقوق برای دانش جوین محفوظ بوده و کپی از آن پیگرد قانونی خواهد داشت

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده

تمامی حقوق برای دانش جوین محفوظ بوده و کپی از آن پیگرد قانونی خواهد داشت