چهارشنبه, مرداد ۲۹, ۱۴۰۴
دانش جوین
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
بدون نتیجه
مشاهده همه نتیجه
  • ورود
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده
بدون نتیجه
مشاهده همه نتیجه
دانش جوین
بدون نتیجه
مشاهده همه نتیجه
صفحه اصلی هوش مصنوعی

هوش مصنوعی Eleven v3 معرفی شد/ طبیعی‌ترین مدل تبدیل متن به گفتار

خبرگزاری ایسنا توسط خبرگزاری ایسنا
۱۹ خرداد ۱۴۰۴
در هوش مصنوعی
زمان خواندن: زمان موردنیاز برای مطالعه: 1 دقیقه
0
A A
هوش مصنوعی Eleven v3 معرفی شد/ طبیعی‌ترین مدل تبدیل متن به گفتار
اشتراک گذاری در تلگراماشتراک گذاری در توییتر

به گزارش ایسنا، هوش مصنوعی «الون وی۳»(Eleven v3) شرکت «الون لبز»(ElevenLabs) که براساس یک ساختار جدید ساخته شده است، واقع‌گرایی و کنترل بی‌سابقه‌ای را برای تولید گفتار به ارمغان می‌آورد. این نرم‌افزار می‌تواند لحن را در اواسط جمله تغییر دهد، به طور یکپارچه بین شخصیت‌ها حرکت کند و به نشانه‌هایی مانند نجوا، خنده و آه کشیدن پاسخ دهد. همه این موارد بدون ایجاد اختلال در جریان گفتار صورت می‌گیرند.

به نقل از دیجیتال ترمینال، این نسخه از هوش مصنوعی الون لبز یک نسخه «آلفا» است. این نسخه نسبت به مدل‌های پیشین به مهندسی سریع‌تری نیاز دارد اما خروجی آن یک تغییر اساسی را در بیان، ظرافت و واقع‌گرایی انسانی ارائه می‌دهد. این نسخه جدید، پشتیبانی از زبان‌های گوناگون را از ۳۳ به بیش از ۷۰ زبان افزایش داده ‌است. با تنظیم دقیق‌تر، قابلیت اطمینان و کنترل‌پذیری نیز افزایش خواهد یافت.

قابلیت‌های مهم الون وی۳ به شرح زیر هستند.

۱. پوشش‌دهی بیش از ۷۰ زبان؛ زبان‌های پوشش‌داده‌شده در الون وی۳ از ۳۳ زبان به بیش از ۷۰ زبان گسترش یافته‌اند و پوشش‌دهی جمعیت جهان از ۶۰ درصد به ۹۰ درصد افزایش داشته است.

۲. حالت گفتگو؛ الون وی۳ وقفه‌های طبیعی، تغییر لحن و جریان احساسی را بین چندین گوینده مدیریت می‌کند.

۳. برچسب‌های صوتی؛ الون وی۳ ارائه خود را با برچسب‌هایی مانند زمزمه، عصبانیت، خنده یا صدای جیرجیر در هدایت می‌کند و امکان کنترل عملکرد را با جزئیات دقیق فراهم می‌آورد.

۴. پشتیبانی از پخش زنده؛ به زودی ویژگی پشتیبانی از پخش زنده به صورت در لحظه برای مراکز تماس و اپراتورهای مکالمه‌ ارائه می‌شود.

۵. API عمومی برای الون وی۳ (آلفا) به زودی منتشر می‌شود. کاربران برای دسترسی زودهنگام می‌توانند با بخش فروش شرکت تماس بگیرند.

الون وی۳ برای سازندگان، توسعه‌دهندگان و شرکت‌هایی طراحی شده است که محتوای شامل داستان‌ها، کتاب‌های صوتی، گفت‌وگوی شخصیت‌ها و تعاملات رسانه‌ای را تولید می‌کنند. این مدل به آزمایش و ارائه بازخورد آگاهانه از متن ارج می‌نهد.

برای موارد استفاده در لحظه و با تأخیر کم مانند هوش مصنوعی محاوره‌ای توصیه شده که کاربران فعلاً با مدل‌های «توربو»(Turbo) و «فلش»(Flash) الون وی۲.۵ کار کنند. نسخه در لحظه الون وی۳ در حال توسعه است.

الون وی۳ کنترل بیان را برای تولید صدا به ارمغان می‌آورد و به جای خوانش‌های ساده، اجراهای واقعی را ممکن می‌سازد. این نسخه می‌تواند احساسات را تغییر دهد، نحوه‌ی بیان را تنظیم کند و یک حرکت روان را بین شخصیت‌های یک نسل داشته باشد. برای اولین بار، گفتار هوش مصنوعی می‌تواند ریتم و ظرافت احساسی مکالمه انسانی را در بیش از ۷۰ زبان دنبال کند.

«ماتی استانیشفسکی»(Mati Staniszewski) از بنیان‌گذاران الون لبز و مدیرعامل این شرکت گفت: الون وی۳ رساترین مدل تبدیل متن به گفتار تا به امروز است که کنترل کامل را بر احساسات، نحوه‌ بیان و نشانه‌های غیر کلامی ارائه می‌دهد. کاربران با استفاده از برچسب‌های صوتی می‌توانند آن را به زمزمه، خنده، تغییر لهجه یا حتی آواز خواندن ترغیب کنند. آنها می‌توانند سرعت، احساسات و سبک را برای مطابقت با هر نوع نوشتار کنترل کنند. با ماموریت جهانی خود، ما خوشحالیم که این مدل را با پشتیبانی از بیش از ۷۰ زبان گسترش می‌دهیم. این نسخه نتیجه‌ چشم‌انداز و رهبری همکار من« پیوتر»(Piotr) و گروه پژوهشی فوق‌العاده‌ای است که او تشکیل داده بود.

ایجاد یک محصول خوب سخت است اما ایجاد یک الگوی کاملاً جدید تقریباً غیر ممکن است. من و همه ما در الون لبز از دیدن جادویی که این تیم به زندگی می‌بخشد، احساس خوش‌شانسی می‌کنیم و با این نسخه هیجان‌زده‌ایم که یک بار دیگر مرزها را جابه‌جا کنیم.

الون وی۳ (آلفا) هم‌اکنون در آدرس https://elevenlabs.io موجود است.

انتهای پیام

شاید برای شما جالب باشد

OpenAI از اشتراک ارزان‌قیمت ChatGPT Go رونمایی کرد؛ ماهی ۴.۶ دلار

دنیای اسباب‌بازی‌ها تغییر می‌کند؛ عرضه عروسک‌های مجهز به هوش مصنوعی

هوش مصنوعی Claude اکنون می‌تواند به مکالمات آزاردهنده پایان دهد

به گزارش ایسنا، هوش مصنوعی «الون وی۳»(Eleven v3) شرکت «الون لبز»(ElevenLabs) که براساس یک ساختار جدید ساخته شده است، واقع‌گرایی و کنترل بی‌سابقه‌ای را برای تولید گفتار به ارمغان می‌آورد. این نرم‌افزار می‌تواند لحن را در اواسط جمله تغییر دهد، به طور یکپارچه بین شخصیت‌ها حرکت کند و به نشانه‌هایی مانند نجوا، خنده و آه کشیدن پاسخ دهد. همه این موارد بدون ایجاد اختلال در جریان گفتار صورت می‌گیرند.

به نقل از دیجیتال ترمینال، این نسخه از هوش مصنوعی الون لبز یک نسخه «آلفا» است. این نسخه نسبت به مدل‌های پیشین به مهندسی سریع‌تری نیاز دارد اما خروجی آن یک تغییر اساسی را در بیان، ظرافت و واقع‌گرایی انسانی ارائه می‌دهد. این نسخه جدید، پشتیبانی از زبان‌های گوناگون را از ۳۳ به بیش از ۷۰ زبان افزایش داده ‌است. با تنظیم دقیق‌تر، قابلیت اطمینان و کنترل‌پذیری نیز افزایش خواهد یافت.

قابلیت‌های مهم الون وی۳ به شرح زیر هستند.

۱. پوشش‌دهی بیش از ۷۰ زبان؛ زبان‌های پوشش‌داده‌شده در الون وی۳ از ۳۳ زبان به بیش از ۷۰ زبان گسترش یافته‌اند و پوشش‌دهی جمعیت جهان از ۶۰ درصد به ۹۰ درصد افزایش داشته است.

۲. حالت گفتگو؛ الون وی۳ وقفه‌های طبیعی، تغییر لحن و جریان احساسی را بین چندین گوینده مدیریت می‌کند.

۳. برچسب‌های صوتی؛ الون وی۳ ارائه خود را با برچسب‌هایی مانند زمزمه، عصبانیت، خنده یا صدای جیرجیر در هدایت می‌کند و امکان کنترل عملکرد را با جزئیات دقیق فراهم می‌آورد.

۴. پشتیبانی از پخش زنده؛ به زودی ویژگی پشتیبانی از پخش زنده به صورت در لحظه برای مراکز تماس و اپراتورهای مکالمه‌ ارائه می‌شود.

۵. API عمومی برای الون وی۳ (آلفا) به زودی منتشر می‌شود. کاربران برای دسترسی زودهنگام می‌توانند با بخش فروش شرکت تماس بگیرند.

الون وی۳ برای سازندگان، توسعه‌دهندگان و شرکت‌هایی طراحی شده است که محتوای شامل داستان‌ها، کتاب‌های صوتی، گفت‌وگوی شخصیت‌ها و تعاملات رسانه‌ای را تولید می‌کنند. این مدل به آزمایش و ارائه بازخورد آگاهانه از متن ارج می‌نهد.

برای موارد استفاده در لحظه و با تأخیر کم مانند هوش مصنوعی محاوره‌ای توصیه شده که کاربران فعلاً با مدل‌های «توربو»(Turbo) و «فلش»(Flash) الون وی۲.۵ کار کنند. نسخه در لحظه الون وی۳ در حال توسعه است.

الون وی۳ کنترل بیان را برای تولید صدا به ارمغان می‌آورد و به جای خوانش‌های ساده، اجراهای واقعی را ممکن می‌سازد. این نسخه می‌تواند احساسات را تغییر دهد، نحوه‌ی بیان را تنظیم کند و یک حرکت روان را بین شخصیت‌های یک نسل داشته باشد. برای اولین بار، گفتار هوش مصنوعی می‌تواند ریتم و ظرافت احساسی مکالمه انسانی را در بیش از ۷۰ زبان دنبال کند.

«ماتی استانیشفسکی»(Mati Staniszewski) از بنیان‌گذاران الون لبز و مدیرعامل این شرکت گفت: الون وی۳ رساترین مدل تبدیل متن به گفتار تا به امروز است که کنترل کامل را بر احساسات، نحوه‌ بیان و نشانه‌های غیر کلامی ارائه می‌دهد. کاربران با استفاده از برچسب‌های صوتی می‌توانند آن را به زمزمه، خنده، تغییر لهجه یا حتی آواز خواندن ترغیب کنند. آنها می‌توانند سرعت، احساسات و سبک را برای مطابقت با هر نوع نوشتار کنترل کنند. با ماموریت جهانی خود، ما خوشحالیم که این مدل را با پشتیبانی از بیش از ۷۰ زبان گسترش می‌دهیم. این نسخه نتیجه‌ چشم‌انداز و رهبری همکار من« پیوتر»(Piotr) و گروه پژوهشی فوق‌العاده‌ای است که او تشکیل داده بود.

ایجاد یک محصول خوب سخت است اما ایجاد یک الگوی کاملاً جدید تقریباً غیر ممکن است. من و همه ما در الون لبز از دیدن جادویی که این تیم به زندگی می‌بخشد، احساس خوش‌شانسی می‌کنیم و با این نسخه هیجان‌زده‌ایم که یک بار دیگر مرزها را جابه‌جا کنیم.

الون وی۳ (آلفا) هم‌اکنون در آدرس https://elevenlabs.io موجود است.

انتهای پیام

پست قبلی

فرزندان کاظم صدیقی بازداشت شدند

پست بعدی

نسخه عربی سریال «هیس، هیچی نیس!» رونمایی می‌شود

پست بعدی
نسخه عربی سریال «هیس، هیچی نیس!» رونمایی می‌شود

نسخه عربی سریال «هیس، هیچی نیس!» رونمایی می‌شود

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دو + 13 =

دو × 1 =

دانلود اپلیکیشن دانش جوین

جدیدترین اخبار

  • برترین پزشکان جهان در آلمان
  • تشییع و خاکسپاری پیکر استاد «محمود فرشچیان» در اصفهان
  • ۳پرده از سیدمجتبی؛دستخوش یک‌قرانی«نواب»که مسعود کیمیایی را سینمایی کرد
  • انتقاد یک تئاتری از بی‌ثباتی مدیریت؛ احساس می‌کنم رها شده‌ام!
  • از انتشار یک آلبوم با حضور ۲ برادر شناخته‌شده تا «بانگ عشق» یک آهنگساز
  • پاسینیک
  • خرید سرور ایران و خارج
  • تجارتخانه آراد برندینگ
  • ویرایش مقاله
  • تابلو لایت باکس
  • قیمت سرور استوک اچ پی hp
  • خرید سرور hp
  • کاغذ a4
  • پرشین هتل
  • راحت ترین روش یادگیری انگلیسی
  • خرید سرور ابری
  • سنگ قبر
  • خرید کتاب زبا انگلیسی – قیمت کتاب زبان انگلیسی با تخفیف – کتاب آموزشی زبان انگلیسی

تمامی حقوق برای دانش جوین محفوظ بوده و کپی از آن پیگرد قانونی خواهد داشت

خوش آمدید!

ورود به حساب کاربری خود در زیر

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای تنظیم مجدد رمز عبور خود وارد کنید.

ورود
بدون نتیجه
مشاهده همه نتیجه
  • نخست
  • علمی
  • تکنولوژی
    • آرشیو تکنولوژی
    • نرم افزار، اپلیکیشن، سیستم عامل
    • خودرو
    • آرشیو فین‌تک
      • IT
      • دوربین
    • لپتاپ و کامپیوتر و سخت افزار
    • موبایل
  • بازی‌های کامپیوتری
  • پزشکی، سلامت، بهداشت
  • هنر و فرهنگ
  • مقالات
  • سایر پیوندها
    • همیار آی‌تی
    • وبکده

تمامی حقوق برای دانش جوین محفوظ بوده و کپی از آن پیگرد قانونی خواهد داشت