دانش جوین
یکشنبه, تیر ۱۵, ۱۴۰۴
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
  • ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی هوش مصنوعی

اپل مدل هوش مصنوعی متفاوت و جذابی را برای برنامه‌نویسی منتشر کرد

دیجیاتو توسط دیجیاتو
۱۵ تیر ۱۴۰۴
در هوش مصنوعی
زمان خواندن: زمان موردنیاز برای مطالعه: 3 دقیقه
0
اپل مدل هوش مصنوعی متفاوت و جذابی را برای برنامه‌نویسی منتشر کرد
0
بازدیدها
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

اپل از طریق پلتفرم Hugging Face یک مدل جدید هوش مصنوعی برای تولید کد منتشر کرده که برخلاف روش‌های رایج، از ساختار تولید ترتیبی متن تبعیت نمی‌کند. این مدل با نام DiffuCode-7B-cpGRPO نه‌تنها قابلیت تولید سریع‌تر را دارد، بلکه می‌تواند به‌طور همزمان چند بخش از کد را بهبود داده و ساختاری منسجم و قابل رقابت با برترین مدل‌های متن‌باز ارائه کند.

اپل مدل DiffuCode-7B-cpGRPO را با تکیه بر مقاله‌ای تحت عنوان DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation توسعه داده است. نکته‌ی جالب اینکه این مدل با تغییر دما می‌تواند بین حالت خودبازگشتی و غیرترتیبی سوییچ کند. دمای بالا آزادی بیشتری در ترتیب تولید توکن‌ها می‌دهد و در نتیجه مدل می‌تواند بخش‌های مختلف کد را به‌صورت غیرخطی تولید کند.

قابلیت‌های مدل اپل

همچنین اپل با اضافه‌کردن یک مرحله آموزشی تحت عنوان coupled-GRPO موفق شده کیفیت تولید کد را در این مدل به شکل محسوسی ارتقاء دهد. به‌طورکلی، DiffuCode-7B-cpGRPO مدلی است با سرعت بالا، انسجام ساختاری بالا، و عملکردی قابل رقابت با بهترین مدل‌های برنامه‌نویسی متن‌باز.

جالب‌تر اینکه مدل اپل بر پایه Qwen2.5-7B توسعه یافته؛ مدل بنیادین متن‌بازی که توسط علی‌بابا ساخته شده است. علی‌بابا ابتدا این مدل را برای تولید کد بهینه‌سازی کرده (با نام Qwen2.5‑Coder‑7B) و سپس اپل نسخه‌ی اختصاصی خود را بر اساس آن طراحی و بازآموزی کرد.

اپل مدل جدید را با یک رمزگشا (Decoder) مبتنی بر انتشار طراحی کرد و پس از آن با بیش از 20 هزار نمونه کدنویسی باکیفیت آن را آموزش داد. این فرآیند منجر به بهبود 4.4 درصدی عملکرد مدل در یک بنچمارک مطرح برنامه‌نویسی شد.

مدل‌های زبانی معمول مانند GPT معمولاً از روش خودبازگشتی استفاده می‌کنند. در این روش، مدل پاسخ را به‌صورت ترتیبی، توکن به توکن، و از چپ به راست تولید می‌کند. هر توکن جدید براساس بازپردازش کل ورودی و توکن‌های قبلی پیش‌بینی می‌شود.

همچنین در مدل‌های زبانی، پارامتر «دما» میزان تصادفی بودن پاسخ را کنترل می‌کند. دمای پایین باعث می‌شود مدل محتمل‌ترین گزینه‌ها را انتخاب کند، در حالی‌که دمای بالا آزادی بیشتری برای انتخاب گزینه‌های کمتر محتمل فراهم می‌کند.

در مقابل، مدل‌های انتشاری (که در مدل‌های تولید تصویر مانند Stable Diffusion استفاده می‌شوند) از یک ورودی نویزدار شروع کرده و آن را مرحله‌به‌مرحله به خروجی مطلوب تبدیل می‌کنند. این روش اخیراً در تولید متن نیز به‌کار گرفته شده و نتایج امیدوارکننده‌ای داشته است.

مزیت اصلی این رویکرد در تولید کد آن است که مدل می‌تواند به‌جای تولید خطی، ساختار کلی کد را در چند مرحله و به‌صورت موازی اصلاح کند — قابلیتی که در برنامه‌نویسی بسیار ارزشمند است.

گرچه هنوز DiffuCoder به سطح مدل‌هایی مانند GPT-4 یا Gemini Diffusion نرسیده، اما این حرکت نشانه‌ای روشن از تلاش اپل برای ورود جدی به عرصه هوش مصنوعی مولد است. این شرکت با روش‌هایی نوآورانه و متفاوت، در حال پایه‌گذاری نسل بعدی مدل‌های زبانی خود است.

اینکه آیا این مدل‌ها در آینده به محصولات واقعی اپل راه پیدا می‌کنند یا خیر، هنوز مشخص نیست؛ اما روشن است که اپل بی‌سروصدا و با دقت، در حال حرکت به سوی آینده‌ای متفاوت در هوش مصنوعی است.

اپل از طریق پلتفرم Hugging Face یک مدل جدید هوش مصنوعی برای تولید کد منتشر کرده که برخلاف روش‌های رایج، از ساختار تولید ترتیبی متن تبعیت نمی‌کند. این مدل با نام DiffuCode-7B-cpGRPO نه‌تنها قابلیت تولید سریع‌تر را دارد، بلکه می‌تواند به‌طور همزمان چند بخش از کد را بهبود داده و ساختاری منسجم و قابل رقابت با برترین مدل‌های متن‌باز ارائه کند.

اپل مدل DiffuCode-7B-cpGRPO را با تکیه بر مقاله‌ای تحت عنوان DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation توسعه داده است. نکته‌ی جالب اینکه این مدل با تغییر دما می‌تواند بین حالت خودبازگشتی و غیرترتیبی سوییچ کند. دمای بالا آزادی بیشتری در ترتیب تولید توکن‌ها می‌دهد و در نتیجه مدل می‌تواند بخش‌های مختلف کد را به‌صورت غیرخطی تولید کند.

قابلیت‌های مدل اپل

همچنین اپل با اضافه‌کردن یک مرحله آموزشی تحت عنوان coupled-GRPO موفق شده کیفیت تولید کد را در این مدل به شکل محسوسی ارتقاء دهد. به‌طورکلی، DiffuCode-7B-cpGRPO مدلی است با سرعت بالا، انسجام ساختاری بالا، و عملکردی قابل رقابت با بهترین مدل‌های برنامه‌نویسی متن‌باز.

جالب‌تر اینکه مدل اپل بر پایه Qwen2.5-7B توسعه یافته؛ مدل بنیادین متن‌بازی که توسط علی‌بابا ساخته شده است. علی‌بابا ابتدا این مدل را برای تولید کد بهینه‌سازی کرده (با نام Qwen2.5‑Coder‑7B) و سپس اپل نسخه‌ی اختصاصی خود را بر اساس آن طراحی و بازآموزی کرد.

اپل مدل جدید را با یک رمزگشا (Decoder) مبتنی بر انتشار طراحی کرد و پس از آن با بیش از 20 هزار نمونه کدنویسی باکیفیت آن را آموزش داد. این فرآیند منجر به بهبود 4.4 درصدی عملکرد مدل در یک بنچمارک مطرح برنامه‌نویسی شد.

مدل‌های زبانی معمول مانند GPT معمولاً از روش خودبازگشتی استفاده می‌کنند. در این روش، مدل پاسخ را به‌صورت ترتیبی، توکن به توکن، و از چپ به راست تولید می‌کند. هر توکن جدید براساس بازپردازش کل ورودی و توکن‌های قبلی پیش‌بینی می‌شود.

همچنین در مدل‌های زبانی، پارامتر «دما» میزان تصادفی بودن پاسخ را کنترل می‌کند. دمای پایین باعث می‌شود مدل محتمل‌ترین گزینه‌ها را انتخاب کند، در حالی‌که دمای بالا آزادی بیشتری برای انتخاب گزینه‌های کمتر محتمل فراهم می‌کند.

در مقابل، مدل‌های انتشاری (که در مدل‌های تولید تصویر مانند Stable Diffusion استفاده می‌شوند) از یک ورودی نویزدار شروع کرده و آن را مرحله‌به‌مرحله به خروجی مطلوب تبدیل می‌کنند. این روش اخیراً در تولید متن نیز به‌کار گرفته شده و نتایج امیدوارکننده‌ای داشته است.

مزیت اصلی این رویکرد در تولید کد آن است که مدل می‌تواند به‌جای تولید خطی، ساختار کلی کد را در چند مرحله و به‌صورت موازی اصلاح کند — قابلیتی که در برنامه‌نویسی بسیار ارزشمند است.

گرچه هنوز DiffuCoder به سطح مدل‌هایی مانند GPT-4 یا Gemini Diffusion نرسیده، اما این حرکت نشانه‌ای روشن از تلاش اپل برای ورود جدی به عرصه هوش مصنوعی مولد است. این شرکت با روش‌هایی نوآورانه و متفاوت، در حال پایه‌گذاری نسل بعدی مدل‌های زبانی خود است.

اینکه آیا این مدل‌ها در آینده به محصولات واقعی اپل راه پیدا می‌کنند یا خیر، هنوز مشخص نیست؛ اما روشن است که اپل بی‌سروصدا و با دقت، در حال حرکت به سوی آینده‌ای متفاوت در هوش مصنوعی است.

اخبارجدیدترین

محققان:‌ در ۱۴ درصد از مقالات علمی نشانه‌های استفاده از هوش مصنوعی وجود دارد

سیری هوشمند احتمالاً با کمک OpenAI یا آنتروپیک ساخته می‌شود

مارک زاکربرگ از آزمایشگاه هوش مصنوعی جدید متا رونمایی کرد؛ رقابت جدی‌تر با OpenAI

اپل از طریق پلتفرم Hugging Face یک مدل جدید هوش مصنوعی برای تولید کد منتشر کرده که برخلاف روش‌های رایج، از ساختار تولید ترتیبی متن تبعیت نمی‌کند. این مدل با نام DiffuCode-7B-cpGRPO نه‌تنها قابلیت تولید سریع‌تر را دارد، بلکه می‌تواند به‌طور همزمان چند بخش از کد را بهبود داده و ساختاری منسجم و قابل رقابت با برترین مدل‌های متن‌باز ارائه کند.

اپل مدل DiffuCode-7B-cpGRPO را با تکیه بر مقاله‌ای تحت عنوان DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation توسعه داده است. نکته‌ی جالب اینکه این مدل با تغییر دما می‌تواند بین حالت خودبازگشتی و غیرترتیبی سوییچ کند. دمای بالا آزادی بیشتری در ترتیب تولید توکن‌ها می‌دهد و در نتیجه مدل می‌تواند بخش‌های مختلف کد را به‌صورت غیرخطی تولید کند.

قابلیت‌های مدل اپل

همچنین اپل با اضافه‌کردن یک مرحله آموزشی تحت عنوان coupled-GRPO موفق شده کیفیت تولید کد را در این مدل به شکل محسوسی ارتقاء دهد. به‌طورکلی، DiffuCode-7B-cpGRPO مدلی است با سرعت بالا، انسجام ساختاری بالا، و عملکردی قابل رقابت با بهترین مدل‌های برنامه‌نویسی متن‌باز.

جالب‌تر اینکه مدل اپل بر پایه Qwen2.5-7B توسعه یافته؛ مدل بنیادین متن‌بازی که توسط علی‌بابا ساخته شده است. علی‌بابا ابتدا این مدل را برای تولید کد بهینه‌سازی کرده (با نام Qwen2.5‑Coder‑7B) و سپس اپل نسخه‌ی اختصاصی خود را بر اساس آن طراحی و بازآموزی کرد.

اپل مدل جدید را با یک رمزگشا (Decoder) مبتنی بر انتشار طراحی کرد و پس از آن با بیش از 20 هزار نمونه کدنویسی باکیفیت آن را آموزش داد. این فرآیند منجر به بهبود 4.4 درصدی عملکرد مدل در یک بنچمارک مطرح برنامه‌نویسی شد.

مدل‌های زبانی معمول مانند GPT معمولاً از روش خودبازگشتی استفاده می‌کنند. در این روش، مدل پاسخ را به‌صورت ترتیبی، توکن به توکن، و از چپ به راست تولید می‌کند. هر توکن جدید براساس بازپردازش کل ورودی و توکن‌های قبلی پیش‌بینی می‌شود.

همچنین در مدل‌های زبانی، پارامتر «دما» میزان تصادفی بودن پاسخ را کنترل می‌کند. دمای پایین باعث می‌شود مدل محتمل‌ترین گزینه‌ها را انتخاب کند، در حالی‌که دمای بالا آزادی بیشتری برای انتخاب گزینه‌های کمتر محتمل فراهم می‌کند.

در مقابل، مدل‌های انتشاری (که در مدل‌های تولید تصویر مانند Stable Diffusion استفاده می‌شوند) از یک ورودی نویزدار شروع کرده و آن را مرحله‌به‌مرحله به خروجی مطلوب تبدیل می‌کنند. این روش اخیراً در تولید متن نیز به‌کار گرفته شده و نتایج امیدوارکننده‌ای داشته است.

مزیت اصلی این رویکرد در تولید کد آن است که مدل می‌تواند به‌جای تولید خطی، ساختار کلی کد را در چند مرحله و به‌صورت موازی اصلاح کند — قابلیتی که در برنامه‌نویسی بسیار ارزشمند است.

گرچه هنوز DiffuCoder به سطح مدل‌هایی مانند GPT-4 یا Gemini Diffusion نرسیده، اما این حرکت نشانه‌ای روشن از تلاش اپل برای ورود جدی به عرصه هوش مصنوعی مولد است. این شرکت با روش‌هایی نوآورانه و متفاوت، در حال پایه‌گذاری نسل بعدی مدل‌های زبانی خود است.

اینکه آیا این مدل‌ها در آینده به محصولات واقعی اپل راه پیدا می‌کنند یا خیر، هنوز مشخص نیست؛ اما روشن است که اپل بی‌سروصدا و با دقت، در حال حرکت به سوی آینده‌ای متفاوت در هوش مصنوعی است.

اپل از طریق پلتفرم Hugging Face یک مدل جدید هوش مصنوعی برای تولید کد منتشر کرده که برخلاف روش‌های رایج، از ساختار تولید ترتیبی متن تبعیت نمی‌کند. این مدل با نام DiffuCode-7B-cpGRPO نه‌تنها قابلیت تولید سریع‌تر را دارد، بلکه می‌تواند به‌طور همزمان چند بخش از کد را بهبود داده و ساختاری منسجم و قابل رقابت با برترین مدل‌های متن‌باز ارائه کند.

اپل مدل DiffuCode-7B-cpGRPO را با تکیه بر مقاله‌ای تحت عنوان DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation توسعه داده است. نکته‌ی جالب اینکه این مدل با تغییر دما می‌تواند بین حالت خودبازگشتی و غیرترتیبی سوییچ کند. دمای بالا آزادی بیشتری در ترتیب تولید توکن‌ها می‌دهد و در نتیجه مدل می‌تواند بخش‌های مختلف کد را به‌صورت غیرخطی تولید کند.

قابلیت‌های مدل اپل

همچنین اپل با اضافه‌کردن یک مرحله آموزشی تحت عنوان coupled-GRPO موفق شده کیفیت تولید کد را در این مدل به شکل محسوسی ارتقاء دهد. به‌طورکلی، DiffuCode-7B-cpGRPO مدلی است با سرعت بالا، انسجام ساختاری بالا، و عملکردی قابل رقابت با بهترین مدل‌های برنامه‌نویسی متن‌باز.

جالب‌تر اینکه مدل اپل بر پایه Qwen2.5-7B توسعه یافته؛ مدل بنیادین متن‌بازی که توسط علی‌بابا ساخته شده است. علی‌بابا ابتدا این مدل را برای تولید کد بهینه‌سازی کرده (با نام Qwen2.5‑Coder‑7B) و سپس اپل نسخه‌ی اختصاصی خود را بر اساس آن طراحی و بازآموزی کرد.

اپل مدل جدید را با یک رمزگشا (Decoder) مبتنی بر انتشار طراحی کرد و پس از آن با بیش از 20 هزار نمونه کدنویسی باکیفیت آن را آموزش داد. این فرآیند منجر به بهبود 4.4 درصدی عملکرد مدل در یک بنچمارک مطرح برنامه‌نویسی شد.

مدل‌های زبانی معمول مانند GPT معمولاً از روش خودبازگشتی استفاده می‌کنند. در این روش، مدل پاسخ را به‌صورت ترتیبی، توکن به توکن، و از چپ به راست تولید می‌کند. هر توکن جدید براساس بازپردازش کل ورودی و توکن‌های قبلی پیش‌بینی می‌شود.

همچنین در مدل‌های زبانی، پارامتر «دما» میزان تصادفی بودن پاسخ را کنترل می‌کند. دمای پایین باعث می‌شود مدل محتمل‌ترین گزینه‌ها را انتخاب کند، در حالی‌که دمای بالا آزادی بیشتری برای انتخاب گزینه‌های کمتر محتمل فراهم می‌کند.

در مقابل، مدل‌های انتشاری (که در مدل‌های تولید تصویر مانند Stable Diffusion استفاده می‌شوند) از یک ورودی نویزدار شروع کرده و آن را مرحله‌به‌مرحله به خروجی مطلوب تبدیل می‌کنند. این روش اخیراً در تولید متن نیز به‌کار گرفته شده و نتایج امیدوارکننده‌ای داشته است.

مزیت اصلی این رویکرد در تولید کد آن است که مدل می‌تواند به‌جای تولید خطی، ساختار کلی کد را در چند مرحله و به‌صورت موازی اصلاح کند — قابلیتی که در برنامه‌نویسی بسیار ارزشمند است.

گرچه هنوز DiffuCoder به سطح مدل‌هایی مانند GPT-4 یا Gemini Diffusion نرسیده، اما این حرکت نشانه‌ای روشن از تلاش اپل برای ورود جدی به عرصه هوش مصنوعی مولد است. این شرکت با روش‌هایی نوآورانه و متفاوت، در حال پایه‌گذاری نسل بعدی مدل‌های زبانی خود است.

اینکه آیا این مدل‌ها در آینده به محصولات واقعی اپل راه پیدا می‌کنند یا خیر، هنوز مشخص نیست؛ اما روشن است که اپل بی‌سروصدا و با دقت، در حال حرکت به سوی آینده‌ای متفاوت در هوش مصنوعی است.

پست قبلی

هوای تهران همچنان در وضعیت قرمز و ناسالم

پست بعدی

ریزش یا ثبات؟ آخرین قیمت دلار، طلا و سکه در بازار امروز + جدول

مربوطه پست ها

محققان:‌ در ۱۴ درصد از مقالات علمی نشانه‌های استفاده از هوش مصنوعی وجود دارد
هوش مصنوعی

محققان:‌ در ۱۴ درصد از مقالات علمی نشانه‌های استفاده از هوش مصنوعی وجود دارد

۱۴ تیر ۱۴۰۴
سیری هوشمند احتمالاً با کمک OpenAI یا آنتروپیک ساخته می‌شود
هوش مصنوعی

سیری هوشمند احتمالاً با کمک OpenAI یا آنتروپیک ساخته می‌شود

۱۰ تیر ۱۴۰۴
مارک زاکربرگ از آزمایشگاه هوش مصنوعی جدید متا رونمایی کرد؛ رقابت جدی‌تر با OpenAI
هوش مصنوعی

مارک زاکربرگ از آزمایشگاه هوش مصنوعی جدید متا رونمایی کرد؛ رقابت جدی‌تر با OpenAI

۱۰ تیر ۱۴۰۴
اولین مسابقه فوتبال ربات‌های انسان‌نما با هوش مصنوعی در چین برگزار شد [تماشا کنید]
هوش مصنوعی

اولین مسابقه فوتبال ربات‌های انسان‌نما با هوش مصنوعی در چین برگزار شد [تماشا کنید]

۱۰ تیر ۱۴۰۴
مدیرعامل آمازون می‌گوید هوش مصنوعی نیاز به کارمندان را کاهش خواهد داد
هوش مصنوعی

مدیرعامل آمازون می‌گوید هوش مصنوعی نیاز به کارمندان را کاهش خواهد داد

۱۰ تیر ۱۴۰۴
عرضه مدل هوش مصنوعی DeepSeek R2 به دلیل نارضایتی مدیرعامل شرکت به تعویق افتاد
هوش مصنوعی

عرضه مدل هوش مصنوعی DeepSeek R2 به دلیل نارضایتی مدیرعامل شرکت به تعویق افتاد

۰۹ تیر ۱۴۰۴

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

چهارده − نه =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • از ماجرای خاک خوردن سینما تا حاشیه در کانون کارگردانان و شورای نمایش
  • از خوانش «پل» تا سنج‌نوازی بوشهری‌ها؛هشتم محرم در «خیمه هنر» چه گذشت؟
  • دنباله «جزر و مد سرخ» ساخته می‌شود؛ احتمال بازگشت دنزل واشینگتن
  • تمرکز خانه نمایش شهرداری روی پرورش نیروی جوان تعزیه‌خوان
  • این باشگاه اماراتی خریدار پر و پاقرص مهدی قایدی شد
  • پاسینیک
  • خرید سرور hp
  • خرید سرور ایران و خارج
  • مانیتور ساینا کوییک
  • خرید یوسی
  • حوله استخری
  • خرید قهوه
  • تجارتخانه آراد برندینگ
  • ویرایش مقاله
  • تابلو لایت باکس
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • قیمت هاست فروشگاهی
  • پرشین هتل
  • خرید لیفتراک دست دوم
  • آموزش علوم اول ابتدایی
  • راحت ترین روش یادگیری انگلیسی

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.