دانش جوین
چهارشنبه, خرداد ۷, ۱۴۰۴
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • کنکور 1404
  • ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • کنکور 1404
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی هوش مصنوعی

رونمایی از هوش مصنوعی ویدئوساز گوگل

خبرگزاری ایسنا توسط خبرگزاری ایسنا
۰۶ خرداد ۱۴۰۴
در هوش مصنوعی
زمان خواندن: زمان موردنیاز برای مطالعه: 1 دقیقه
0
رونمایی از هوش مصنوعی ویدئوساز گوگل
1
بازدیدها
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

به گزارش ایسنا، شرکت گوگل به عنوان بخشی از اعلامیه‌های امسال خود در کنفرانس توسعه دهندگان I/O، جدیدترین مدل‌های رسانه‌ای خود را معرفی کرده است که قابل توجه‌ترین آنها شاید «Veo 3» باشد که اولین نسخه از این مدل است که می‌تواند ویدئوهایی با صدا تولید کند.

برای مثال، می‌تواند ویدئویی از پرندگان با صدای آوازشان یا یک خیابان شهری با صدای ترافیک در پس‌زمینه ایجاد کند.

گوگل می‌گوید «Veo 3» همچنین در تجسم فیزیک دنیای واقعی و در همگام سازی لب‌ها عملکرد خوبی دارد.

در حال حاضر، این مدل فقط برای مشترکین Gemini Ultra در ایالات متحده در برنامه جمینای(Gemini) و برای کاربران سازمانی در «Vertex AI» در دسترس است. همچنین در «Flow» (ابزار جدید ساخت فیلم هوش مصنوعی گوگل) نیز در دسترس است.

ابزار «Flow»، مدل  Veo، Imagen و Gemini را برای ساختن کلیپ‌ها و صحنه‌های سینمایی گرد هم می‌آورد. کاربران می‌توانند خروجی نهایی را که می‌خواهند به زبان طبیعی توصیف کنند و «Flow» دست به کار خواهد شد تا آن را برای آنها بسازد.

این ابزار جدید در حال حاضر فقط برای مشترکین گوگل AI Pro و Ultra در ایالات متحده در دسترس خواهد بود، اما گوگل می‌گوید که به زودی در کشورهای بیشتری عرضه خواهد شد.

در حالی که این شرکت یک مدل کاملاً جدید تولید کننده ویدئو را منتشر کرده است، اما هنوز «Veo 2» را رها نکرده است. کاربران می‌توانند تصاویری از افراد، صحنه‌ها، سبک‌ها و اشیاء به «Veo 2» بدهند تا به عنوان مرجع برای خروجی مورد نظر خود در «Flow» استفاده کنند. آنها به کنترل‌های دوربین دسترسی خواهند داشت که به آنها اجازه می‌دهد صحنه‌ها را بچرخانند و روی اشیاء خاص برای «Flow» بزرگنمایی کنند.

به‌علاوه، اگر بخواهند می‌توانند فریم‌های خود را از عمودی به افقی تغییر دهند و اشیاء را از ویدئوهای خود اضافه یا حذف کنند.

گوگل همچنین آخرین مدل تولید کننده تصویر خود موسمو به «Imagen 4» را در این مراسم معرفی کرد. این شرکت گفت «Imagen 4» جزئیات ظریفی مانند پیچ و تاب پارچه‌ها و خز حیوانات را با شفافیت قابل توجه نشان می‌دهد و در تولید تصاویر فوتورئالیستی و انتزاعی برتری دارد.

همچنین می‌تواند تصاویری در نسبت‌های مختلف با وضوح تا 2K ایجاد کند.

مدل «Imagen 4» اکنون از طریق برنامه Gemini، Vertex AI و در برنامه‌های Workspace از جمله Docs و Slides در دسترس است.

گوگل همچنین اعلام کرد که به زودی نسخه‌ای از «Imagen 4» را که 10 برابر سریعتر از «Imagen 3» است، منتشر خواهد کرد.

در نهایت، گوگل برای کمک به مردم برای شناسایی محتوای تولید شده توسط هوش مصنوعی که این روزها سخت‌تر از هر زمانی شده است، ابزار «SynthID Detector» را راه‌اندازی کرده است که پورتالی است که در آن کاربران می‌توانند قطعه‌ای از یک محتوای رسانه‌ای را که فکر می‌کنند با هوش مصنوعی تولید شده است، آپلود کنند و گوگل تعیین می‌کند که آیا کار هوش مصنوعی است یا خیر.

انتهای پیام

به گزارش ایسنا، شرکت گوگل به عنوان بخشی از اعلامیه‌های امسال خود در کنفرانس توسعه دهندگان I/O، جدیدترین مدل‌های رسانه‌ای خود را معرفی کرده است که قابل توجه‌ترین آنها شاید «Veo 3» باشد که اولین نسخه از این مدل است که می‌تواند ویدئوهایی با صدا تولید کند.

برای مثال، می‌تواند ویدئویی از پرندگان با صدای آوازشان یا یک خیابان شهری با صدای ترافیک در پس‌زمینه ایجاد کند.

گوگل می‌گوید «Veo 3» همچنین در تجسم فیزیک دنیای واقعی و در همگام سازی لب‌ها عملکرد خوبی دارد.

در حال حاضر، این مدل فقط برای مشترکین Gemini Ultra در ایالات متحده در برنامه جمینای(Gemini) و برای کاربران سازمانی در «Vertex AI» در دسترس است. همچنین در «Flow» (ابزار جدید ساخت فیلم هوش مصنوعی گوگل) نیز در دسترس است.

ابزار «Flow»، مدل  Veo، Imagen و Gemini را برای ساختن کلیپ‌ها و صحنه‌های سینمایی گرد هم می‌آورد. کاربران می‌توانند خروجی نهایی را که می‌خواهند به زبان طبیعی توصیف کنند و «Flow» دست به کار خواهد شد تا آن را برای آنها بسازد.

این ابزار جدید در حال حاضر فقط برای مشترکین گوگل AI Pro و Ultra در ایالات متحده در دسترس خواهد بود، اما گوگل می‌گوید که به زودی در کشورهای بیشتری عرضه خواهد شد.

در حالی که این شرکت یک مدل کاملاً جدید تولید کننده ویدئو را منتشر کرده است، اما هنوز «Veo 2» را رها نکرده است. کاربران می‌توانند تصاویری از افراد، صحنه‌ها، سبک‌ها و اشیاء به «Veo 2» بدهند تا به عنوان مرجع برای خروجی مورد نظر خود در «Flow» استفاده کنند. آنها به کنترل‌های دوربین دسترسی خواهند داشت که به آنها اجازه می‌دهد صحنه‌ها را بچرخانند و روی اشیاء خاص برای «Flow» بزرگنمایی کنند.

به‌علاوه، اگر بخواهند می‌توانند فریم‌های خود را از عمودی به افقی تغییر دهند و اشیاء را از ویدئوهای خود اضافه یا حذف کنند.

گوگل همچنین آخرین مدل تولید کننده تصویر خود موسمو به «Imagen 4» را در این مراسم معرفی کرد. این شرکت گفت «Imagen 4» جزئیات ظریفی مانند پیچ و تاب پارچه‌ها و خز حیوانات را با شفافیت قابل توجه نشان می‌دهد و در تولید تصاویر فوتورئالیستی و انتزاعی برتری دارد.

همچنین می‌تواند تصاویری در نسبت‌های مختلف با وضوح تا 2K ایجاد کند.

مدل «Imagen 4» اکنون از طریق برنامه Gemini، Vertex AI و در برنامه‌های Workspace از جمله Docs و Slides در دسترس است.

گوگل همچنین اعلام کرد که به زودی نسخه‌ای از «Imagen 4» را که 10 برابر سریعتر از «Imagen 3» است، منتشر خواهد کرد.

در نهایت، گوگل برای کمک به مردم برای شناسایی محتوای تولید شده توسط هوش مصنوعی که این روزها سخت‌تر از هر زمانی شده است، ابزار «SynthID Detector» را راه‌اندازی کرده است که پورتالی است که در آن کاربران می‌توانند قطعه‌ای از یک محتوای رسانه‌ای را که فکر می‌کنند با هوش مصنوعی تولید شده است، آپلود کنند و گوگل تعیین می‌کند که آیا کار هوش مصنوعی است یا خیر.

انتهای پیام

اخبارجدیدترین

مرورگر اپرا Neon با ایجنت هوش مصنوعی و قابلیت کدنویسی معرفی شد

پارادوکس تلخ ایران: دومین صادرکننده استعداد به آمریکا، آینده‌ای تاریک در زمینه هوش مصنوعی دارد

وردپرس با تشکیل تیم هوش مصنوعی وارد فاز جدیدی از توسعه می‌شود

به گزارش ایسنا، شرکت گوگل به عنوان بخشی از اعلامیه‌های امسال خود در کنفرانس توسعه دهندگان I/O، جدیدترین مدل‌های رسانه‌ای خود را معرفی کرده است که قابل توجه‌ترین آنها شاید «Veo 3» باشد که اولین نسخه از این مدل است که می‌تواند ویدئوهایی با صدا تولید کند.

برای مثال، می‌تواند ویدئویی از پرندگان با صدای آوازشان یا یک خیابان شهری با صدای ترافیک در پس‌زمینه ایجاد کند.

گوگل می‌گوید «Veo 3» همچنین در تجسم فیزیک دنیای واقعی و در همگام سازی لب‌ها عملکرد خوبی دارد.

در حال حاضر، این مدل فقط برای مشترکین Gemini Ultra در ایالات متحده در برنامه جمینای(Gemini) و برای کاربران سازمانی در «Vertex AI» در دسترس است. همچنین در «Flow» (ابزار جدید ساخت فیلم هوش مصنوعی گوگل) نیز در دسترس است.

ابزار «Flow»، مدل  Veo، Imagen و Gemini را برای ساختن کلیپ‌ها و صحنه‌های سینمایی گرد هم می‌آورد. کاربران می‌توانند خروجی نهایی را که می‌خواهند به زبان طبیعی توصیف کنند و «Flow» دست به کار خواهد شد تا آن را برای آنها بسازد.

این ابزار جدید در حال حاضر فقط برای مشترکین گوگل AI Pro و Ultra در ایالات متحده در دسترس خواهد بود، اما گوگل می‌گوید که به زودی در کشورهای بیشتری عرضه خواهد شد.

در حالی که این شرکت یک مدل کاملاً جدید تولید کننده ویدئو را منتشر کرده است، اما هنوز «Veo 2» را رها نکرده است. کاربران می‌توانند تصاویری از افراد، صحنه‌ها، سبک‌ها و اشیاء به «Veo 2» بدهند تا به عنوان مرجع برای خروجی مورد نظر خود در «Flow» استفاده کنند. آنها به کنترل‌های دوربین دسترسی خواهند داشت که به آنها اجازه می‌دهد صحنه‌ها را بچرخانند و روی اشیاء خاص برای «Flow» بزرگنمایی کنند.

به‌علاوه، اگر بخواهند می‌توانند فریم‌های خود را از عمودی به افقی تغییر دهند و اشیاء را از ویدئوهای خود اضافه یا حذف کنند.

گوگل همچنین آخرین مدل تولید کننده تصویر خود موسمو به «Imagen 4» را در این مراسم معرفی کرد. این شرکت گفت «Imagen 4» جزئیات ظریفی مانند پیچ و تاب پارچه‌ها و خز حیوانات را با شفافیت قابل توجه نشان می‌دهد و در تولید تصاویر فوتورئالیستی و انتزاعی برتری دارد.

همچنین می‌تواند تصاویری در نسبت‌های مختلف با وضوح تا 2K ایجاد کند.

مدل «Imagen 4» اکنون از طریق برنامه Gemini، Vertex AI و در برنامه‌های Workspace از جمله Docs و Slides در دسترس است.

گوگل همچنین اعلام کرد که به زودی نسخه‌ای از «Imagen 4» را که 10 برابر سریعتر از «Imagen 3» است، منتشر خواهد کرد.

در نهایت، گوگل برای کمک به مردم برای شناسایی محتوای تولید شده توسط هوش مصنوعی که این روزها سخت‌تر از هر زمانی شده است، ابزار «SynthID Detector» را راه‌اندازی کرده است که پورتالی است که در آن کاربران می‌توانند قطعه‌ای از یک محتوای رسانه‌ای را که فکر می‌کنند با هوش مصنوعی تولید شده است، آپلود کنند و گوگل تعیین می‌کند که آیا کار هوش مصنوعی است یا خیر.

انتهای پیام

به گزارش ایسنا، شرکت گوگل به عنوان بخشی از اعلامیه‌های امسال خود در کنفرانس توسعه دهندگان I/O، جدیدترین مدل‌های رسانه‌ای خود را معرفی کرده است که قابل توجه‌ترین آنها شاید «Veo 3» باشد که اولین نسخه از این مدل است که می‌تواند ویدئوهایی با صدا تولید کند.

برای مثال، می‌تواند ویدئویی از پرندگان با صدای آوازشان یا یک خیابان شهری با صدای ترافیک در پس‌زمینه ایجاد کند.

گوگل می‌گوید «Veo 3» همچنین در تجسم فیزیک دنیای واقعی و در همگام سازی لب‌ها عملکرد خوبی دارد.

در حال حاضر، این مدل فقط برای مشترکین Gemini Ultra در ایالات متحده در برنامه جمینای(Gemini) و برای کاربران سازمانی در «Vertex AI» در دسترس است. همچنین در «Flow» (ابزار جدید ساخت فیلم هوش مصنوعی گوگل) نیز در دسترس است.

ابزار «Flow»، مدل  Veo، Imagen و Gemini را برای ساختن کلیپ‌ها و صحنه‌های سینمایی گرد هم می‌آورد. کاربران می‌توانند خروجی نهایی را که می‌خواهند به زبان طبیعی توصیف کنند و «Flow» دست به کار خواهد شد تا آن را برای آنها بسازد.

این ابزار جدید در حال حاضر فقط برای مشترکین گوگل AI Pro و Ultra در ایالات متحده در دسترس خواهد بود، اما گوگل می‌گوید که به زودی در کشورهای بیشتری عرضه خواهد شد.

در حالی که این شرکت یک مدل کاملاً جدید تولید کننده ویدئو را منتشر کرده است، اما هنوز «Veo 2» را رها نکرده است. کاربران می‌توانند تصاویری از افراد، صحنه‌ها، سبک‌ها و اشیاء به «Veo 2» بدهند تا به عنوان مرجع برای خروجی مورد نظر خود در «Flow» استفاده کنند. آنها به کنترل‌های دوربین دسترسی خواهند داشت که به آنها اجازه می‌دهد صحنه‌ها را بچرخانند و روی اشیاء خاص برای «Flow» بزرگنمایی کنند.

به‌علاوه، اگر بخواهند می‌توانند فریم‌های خود را از عمودی به افقی تغییر دهند و اشیاء را از ویدئوهای خود اضافه یا حذف کنند.

گوگل همچنین آخرین مدل تولید کننده تصویر خود موسمو به «Imagen 4» را در این مراسم معرفی کرد. این شرکت گفت «Imagen 4» جزئیات ظریفی مانند پیچ و تاب پارچه‌ها و خز حیوانات را با شفافیت قابل توجه نشان می‌دهد و در تولید تصاویر فوتورئالیستی و انتزاعی برتری دارد.

همچنین می‌تواند تصاویری در نسبت‌های مختلف با وضوح تا 2K ایجاد کند.

مدل «Imagen 4» اکنون از طریق برنامه Gemini، Vertex AI و در برنامه‌های Workspace از جمله Docs و Slides در دسترس است.

گوگل همچنین اعلام کرد که به زودی نسخه‌ای از «Imagen 4» را که 10 برابر سریعتر از «Imagen 3» است، منتشر خواهد کرد.

در نهایت، گوگل برای کمک به مردم برای شناسایی محتوای تولید شده توسط هوش مصنوعی که این روزها سخت‌تر از هر زمانی شده است، ابزار «SynthID Detector» را راه‌اندازی کرده است که پورتالی است که در آن کاربران می‌توانند قطعه‌ای از یک محتوای رسانه‌ای را که فکر می‌کنند با هوش مصنوعی تولید شده است، آپلود کنند و گوگل تعیین می‌کند که آیا کار هوش مصنوعی است یا خیر.

انتهای پیام

پست قبلی

همکاری ۱۵۰ میلیون دلاری «گوگل» برای توسعه عینک هوش مصنوعی

پست بعدی

پوتین: مایکروسافت و زوم علیه منافع ملی روسیه‌اند

مربوطه پست ها

مرورگر اپرا Neon با ایجنت هوش مصنوعی و قابلیت کدنویسی معرفی شد
هوش مصنوعی

مرورگر اپرا Neon با ایجنت هوش مصنوعی و قابلیت کدنویسی معرفی شد

۰۷ خرداد ۱۴۰۴
پارادوکس تلخ ایران: دومین صادرکننده استعداد به آمریکا، آینده‌ای تاریک در زمینه هوش مصنوعی دارد
هوش مصنوعی

پارادوکس تلخ ایران: دومین صادرکننده استعداد به آمریکا، آینده‌ای تاریک در زمینه هوش مصنوعی دارد

۰۷ خرداد ۱۴۰۴
وردپرس با تشکیل تیم هوش مصنوعی وارد فاز جدیدی از توسعه می‌شود
هوش مصنوعی

وردپرس با تشکیل تیم هوش مصنوعی وارد فاز جدیدی از توسعه می‌شود

۰۷ خرداد ۱۴۰۴
پاول دورف: هوش مصنوعی گراک تابستان امسال به تلگرام می‌آید [تماشا کنید]
هوش مصنوعی

پاول دورف: هوش مصنوعی گراک تابستان امسال به تلگرام می‌آید [تماشا کنید]

۰۷ خرداد ۱۴۰۴
جستجوی وب برای کاربران رایگان «کلود» در دسترس قرار گرفت
هوش مصنوعی

جستجوی وب برای کاربران رایگان «کلود» در دسترس قرار گرفت

۰۷ خرداد ۱۴۰۴
چت‌بات «کلود» به حالت صوتی مجهز می‌شود
هوش مصنوعی

چت‌بات «کلود» به حالت صوتی مجهز می‌شود

۰۷ خرداد ۱۴۰۴

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

5 × 2 =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • ادامه طرح کالابرگ فقط برای دهک های پایین است؟
  • آغاز زندگی مشترک یک زوج با «عروسی خوبان» رادیو صبا
  • توافق تاریخی ایران با عمان | انتقال پول آسان شد
  • سود نجومی عراق از تحریم ایران !
  • آمریکا مسیر بازار طلا را مشخص کرد
  • پاسینیک
  • نهال گردو از رویال نهال
  • خرید سرور hp
  • تعمیر کامپیوتر در محل
  • خرید اکشن فیگور انیمه و بازی
  • هدایای تبلیغاتی
  • خرید سرور ایران و خارج
  • مانیتور ساینا کوییک
  • خرید یوسی
  • حوله استخری
  • خرید قهوه
  • تجارتخانه آراد برندینگ
  • خرید قسطی ایفون 16
  • ویرایش مقاله
  • دارالترجمه به زبان عربی در تهران
  • نرم افزار کنترل تردد
  • تابلو لایت باکس
  • خرید سرور مجازی
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • قیمت هاست فروشگاهی
  • پرشین هتل
  • خرید لیفتراک دست دوم

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • کنکور 1404

تمام حقوق مادی و معنوی وب‌سایت دانش جوین محفوظ است و کپی بدون ذکر منبع قابل پیگرد قانونی خواهد بود.