پنجشنبه, مرداد ۳۰, ۱۴۰۴
دانش جوین
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
بدون نتیجه
مشاهده همه نتیجه
  • ورود
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی هوش مصنوعی

بهبود استدلال، ویژگی‌های صوتی و پشتیبانی چندزبانه در هوش مصنوعی «گوگل»

خبرگزاری ایسنا توسط خبرگزاری ایسنا
۰۱ خرداد ۱۴۰۴
در هوش مصنوعی
زمان خواندن: زمان موردنیاز برای مطالعه: 1 دقیقه
0
A A
بهبود استدلال، ویژگی‌های صوتی و پشتیبانی چندزبانه در هوش مصنوعی «گوگل»
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

به گزارش ایسنا، گوگل در کنفرانس «Google I/O 2025» از به‌روزرسانی‌های جدیدی برای مجموعه مدل‌های «جمینای ۲.۵»(Gemini 2.5) خود رونمایی کرد که شامل استدلال قوی‌تر، خروجی صدای بومی، ارتقاء امنیت و قابلیت‌های بهبودیافته برای توسعه‌دهندگان است. گوگل در اعلام به‌روزرسانی‌های جدید گفت: ما در ماه مارس «جمینای ۲.۵ پرو»(Gemini 2.5 Pro) را معرفی کردیم که هوشمندترین مدل ما تا به امروز است و امروز، قابلیت‌های جدیدی را به ۲.۵ پرو و «۲.۵ فلش»(2.5 Flash) اضافه می‌کنیم.

به نقل از تایمز آو ایندیا، مدل ارتقاءیافته جمینای ۲.۵ پرو اکنون در صدر نمودارهای عملکرد از جمله «WebDev Arena» برای کدنویسی و «LMArena» برای آزمایش ترجیحات انسانی قرار دارد. همچنین، این مدل دارای یک پنجره زمینه با یک میلیون توکن است که به آن امکان می‌دهد تا ورودی‌های طولانی‌تر و وظایف درک ویدئو را مدیریت کند.

گوگل اعلام کرد: به لطف «LearnLM» – نسخه‌ای از جمینای که با متخصصان آموزشی توسعه داده شده – این مدل اکنون در وظایف مرتبط با یادگیری نیز پیشرو است. مربیان و متخصصان، جمینای ۲.۵ پرو را در طیف متنوعی از سناریوها نسبت به سایر مدل‌ها ترجیح دادند.

صدای بومی، گفت‌وگوی احساسی و پشتیبانی چندزبانه

گوگل خروجی صدای بومی را نیز برای داشتن یک تجربه طبیعی‌تر با هوش مصنوعی معرفی کرد. جمینای اکنون می‌تواند با تُن‌ها، لهجه‌ها و سبک‌های گوناگون صحبت کند. برای مثال، هنگام تعریف کردن یک داستان می‌تواند صدای دراماتیک داشته باشد. موارد دیگر بهبود صوتی به شرح زیر هستند:

۱. احساسات کاربر را تشخیص می‌دهد و بر اساس آنها پاسخ می‌دهد (گفتگوی عاطفی).

۲. نویز پس‌زمینه را نادیده می‌گیرد (صدای فعال).

۳. وظایف صوتی پیچیده‌تر را انجام می‌دهد (تفکر در API زنده).

سیستم تبدیل متن به گفتار اکنون از چندین گوینده و بیش از ۲۴ زبان پشتیبانی می‌کند و می‌تواند هنگام گفت‌وگو بین زبان‌ها جابه‌جا شود. این ویژگی‌ها از طریق رابط برنامه‌نویسی جمینای در دسترس خواهند بود.

تفکر عمیق برای کارهای پیچیده

گوگل اعلام کرد که در حال آزمایش یک حالت استدلال پیشرفته به نام «تفکر عمیق» است که به جمینای کمک می‌کند تا پیش از پاسخ دادن، چندین پاسخ را در نظر بگیرد. این حالت برای چالش‌های دشواری مانند ریاضیات پیشرفته و برنامه‌نویسی طراحی شده است.

سخنگوی این شرکت گفت: ما در حال آغاز کردن آزمایش یک حالت استدلال بهبودیافته به نام «دیپ ثینک»(Deep Think) هستیم. ما زمان بیشتری را به ارزیابی‌های ایمنی پیشرفته‌تر و دریافت نظرات بیشتر از متخصصان ایمنی اختصاص می‌دهیم.

دیپ ثینک در حال حاضر در معیارهایی مانند «2025 USAMO» برای ریاضی، «LiveCodeBench» برای کدنویسی و «MMMU» برای استدلال چندوجهی پیشرو است.

افزایش سرعت و کارآیی جمینای ۲.۵ فلش

این شرکت اعلام کرد جمینای ۲.۵ فلش که نسخه سبک‌تر مدل است، اکنون از ۲۰ تا ۳۰ درصد توکن کمتر استفاده می‌کند و در عین حال، استدلال، کدنویسی و وظایف چندوجهی را بهبود می‌بخشد. این نسخه اکنون در اپلیکیشن جمینای و پلتفرم‌های «ای‌آی استودیو»(AI Studio) و «ورتکس ای‌آی»(Vertex AI) در دسترس است.

انتظار می‌رود نسخه عمومی مدل به‌روزرسانی‌شده در اوایل ژوئن عرضه شود و نسخه ۲.۵ پرو نیز اندکی پس از آن از راه برسد.

انتهای پیام

شاید برای شما جالب باشد

انویدیا تراشه‌های هوش مصنوعی قوی‌تر از H20 برای بازار چین می‌سازد

رقیبی برای فتوشاپ؛ هوش مصنوعی جدید علی‌بابا ویرایش دقیق تصاویر را ساده می‌کند

مدل هوش مصنوعی دیپ‌سیک V3.1 با پنجره محتوایی بزرگ‌تر منتشر شد

به گزارش ایسنا، گوگل در کنفرانس «Google I/O 2025» از به‌روزرسانی‌های جدیدی برای مجموعه مدل‌های «جمینای ۲.۵»(Gemini 2.5) خود رونمایی کرد که شامل استدلال قوی‌تر، خروجی صدای بومی، ارتقاء امنیت و قابلیت‌های بهبودیافته برای توسعه‌دهندگان است. گوگل در اعلام به‌روزرسانی‌های جدید گفت: ما در ماه مارس «جمینای ۲.۵ پرو»(Gemini 2.5 Pro) را معرفی کردیم که هوشمندترین مدل ما تا به امروز است و امروز، قابلیت‌های جدیدی را به ۲.۵ پرو و «۲.۵ فلش»(2.5 Flash) اضافه می‌کنیم.

به نقل از تایمز آو ایندیا، مدل ارتقاءیافته جمینای ۲.۵ پرو اکنون در صدر نمودارهای عملکرد از جمله «WebDev Arena» برای کدنویسی و «LMArena» برای آزمایش ترجیحات انسانی قرار دارد. همچنین، این مدل دارای یک پنجره زمینه با یک میلیون توکن است که به آن امکان می‌دهد تا ورودی‌های طولانی‌تر و وظایف درک ویدئو را مدیریت کند.

گوگل اعلام کرد: به لطف «LearnLM» – نسخه‌ای از جمینای که با متخصصان آموزشی توسعه داده شده – این مدل اکنون در وظایف مرتبط با یادگیری نیز پیشرو است. مربیان و متخصصان، جمینای ۲.۵ پرو را در طیف متنوعی از سناریوها نسبت به سایر مدل‌ها ترجیح دادند.

صدای بومی، گفت‌وگوی احساسی و پشتیبانی چندزبانه

گوگل خروجی صدای بومی را نیز برای داشتن یک تجربه طبیعی‌تر با هوش مصنوعی معرفی کرد. جمینای اکنون می‌تواند با تُن‌ها، لهجه‌ها و سبک‌های گوناگون صحبت کند. برای مثال، هنگام تعریف کردن یک داستان می‌تواند صدای دراماتیک داشته باشد. موارد دیگر بهبود صوتی به شرح زیر هستند:

۱. احساسات کاربر را تشخیص می‌دهد و بر اساس آنها پاسخ می‌دهد (گفتگوی عاطفی).

۲. نویز پس‌زمینه را نادیده می‌گیرد (صدای فعال).

۳. وظایف صوتی پیچیده‌تر را انجام می‌دهد (تفکر در API زنده).

سیستم تبدیل متن به گفتار اکنون از چندین گوینده و بیش از ۲۴ زبان پشتیبانی می‌کند و می‌تواند هنگام گفت‌وگو بین زبان‌ها جابه‌جا شود. این ویژگی‌ها از طریق رابط برنامه‌نویسی جمینای در دسترس خواهند بود.

تفکر عمیق برای کارهای پیچیده

گوگل اعلام کرد که در حال آزمایش یک حالت استدلال پیشرفته به نام «تفکر عمیق» است که به جمینای کمک می‌کند تا پیش از پاسخ دادن، چندین پاسخ را در نظر بگیرد. این حالت برای چالش‌های دشواری مانند ریاضیات پیشرفته و برنامه‌نویسی طراحی شده است.

سخنگوی این شرکت گفت: ما در حال آغاز کردن آزمایش یک حالت استدلال بهبودیافته به نام «دیپ ثینک»(Deep Think) هستیم. ما زمان بیشتری را به ارزیابی‌های ایمنی پیشرفته‌تر و دریافت نظرات بیشتر از متخصصان ایمنی اختصاص می‌دهیم.

دیپ ثینک در حال حاضر در معیارهایی مانند «2025 USAMO» برای ریاضی، «LiveCodeBench» برای کدنویسی و «MMMU» برای استدلال چندوجهی پیشرو است.

افزایش سرعت و کارآیی جمینای ۲.۵ فلش

این شرکت اعلام کرد جمینای ۲.۵ فلش که نسخه سبک‌تر مدل است، اکنون از ۲۰ تا ۳۰ درصد توکن کمتر استفاده می‌کند و در عین حال، استدلال، کدنویسی و وظایف چندوجهی را بهبود می‌بخشد. این نسخه اکنون در اپلیکیشن جمینای و پلتفرم‌های «ای‌آی استودیو»(AI Studio) و «ورتکس ای‌آی»(Vertex AI) در دسترس است.

انتظار می‌رود نسخه عمومی مدل به‌روزرسانی‌شده در اوایل ژوئن عرضه شود و نسخه ۲.۵ پرو نیز اندکی پس از آن از راه برسد.

انتهای پیام

پست قبلی

هوش مصنوعی گوگل به جی‌میل‌ها پاسخ می‌دهد

پست بعدی

هوش مصنوعی، طراح پروتئین می‌شود!

پست بعدی
هوش مصنوعی، طراح پروتئین می‌شود!

هوش مصنوعی، طراح پروتئین می‌شود!

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

3 × 5 =

چهار × 5 =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • آغاز محدودیت‌های ترافیکی از فردا در جاده‌های شمال
  • ادارات لرستان چهارشنبه ۲۹ مرداد تعطیل شد
  • هر دو باند تونل توحید امشب مسدود می‌شود
  • المپیادی‌ها از «سربازی» معاف نیستند
  • گزارش یک خداحافظی موسیقایی؛ در کنسرت «نامیرا» چه گذشت؟
  • پاسینیک
  • خرید سرور ایران و خارج
  • تجارتخانه آراد برندینگ
  • ویرایش مقاله
  • تابلو لایت باکس
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • پرشین هتل
  • راحت ترین روش یادگیری انگلیسی
  • خرید سرور ابری
  • سنگ قبر
  • خرید کتاب زبا انگلیسی – قیمت کتاب زبان انگلیسی با تخفیف – کتاب آموزشی زبان انگلیسی

تمامی حقوق برای دانش جوین محفوظ بوده و کپی از آن پیگرد قانونی خواهد داشت

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده

تمامی حقوق برای دانش جوین محفوظ بوده و کپی از آن پیگرد قانونی خواهد داشت