دوشنبه, خرداد ۱۱, ۱۴۰۵
دانش جوین
  • تازه‌های تکنولوژی
  • بازی‌های رایانه‌ای
  • فناوری اطلاعات
    • سخت افزار
    • موبایل
    • اینترنت
      • هک و امنیت سایبری
  • هوش مصنوعی
  • دانش اقتصادی
    • صنعت و تجارت
    • دانش معماری
    • حمل و نقل
      • خودرو
    • ارزدیجیتال
  • دانش سیاسی
    • بین المللی
      • گردشگری و مهاجرت
  • دانش اجتماعی
    • دانشگاه
    • دانش حقوقی
    • دانش پزشکی
      • ورزش
      • محیط زیست
  • وب‌جوین
    • همیار آی تی
    • وب کده
    • دستکش لاتکس
بدون نتیجه
مشاهده تمام نتایج
  • تازه‌های تکنولوژی
  • بازی‌های رایانه‌ای
  • فناوری اطلاعات
    • سخت افزار
    • موبایل
    • اینترنت
      • هک و امنیت سایبری
  • هوش مصنوعی
  • دانش اقتصادی
    • صنعت و تجارت
    • دانش معماری
    • حمل و نقل
      • خودرو
    • ارزدیجیتال
  • دانش سیاسی
    • بین المللی
      • گردشگری و مهاجرت
  • دانش اجتماعی
    • دانشگاه
    • دانش حقوقی
    • دانش پزشکی
      • ورزش
      • محیط زیست
  • وب‌جوین
    • همیار آی تی
    • وب کده
    • دستکش لاتکس
بدون نتیجه
مشاهده تمام نتایج
دانش جوین
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی اخبار تکنولوژی

آمازون در حال توسعه بزرگ‌ترین مدل هوش مصنوعی تبدیل متن به گفتار است

کارشناس روابط عمومی توسط کارشناس روابط عمومی
۰۴ مهر ۱۴۰۳
در اخبار تکنولوژی
مدت زمان مطالعه: 2 دقیقه
1
آمازون در حال توسعه بزرگ‌ترین مدل هوش مصنوعی تبدیل متن به گفتار است

محققان آمازون ادعا کرده‌اند که بزرگ‌ترین مدل هوش مصنوعی تبدیل متن به گفتار را آموزش داده‌اند. این مدل جدید که BASE TTS نام دارد، با 100 هزار ساعت اطلاعات صوتی آموزش داده شده است و با قابلیت‌های بی‌سابقه خود، می‌تواند در حوزه مدل‌های تبدیل متن به صدا انقلابی ظاهر شود.

مدل جدید آمازون Big Adaptive Streamable TTS با قابلیت‌های نوظهور نام دارد که به‌صورت مخفف و با عنوان BASE TTS شناخته می‌شود. برای آموزش بزرگ‌ترین نسخه این مدل از 100 هزار ساعت سخنرانی در حوزه عمومی استفاده شده که 90 درصد آن به زبان انگلیسی و بخش دیگر به زبان‌های آلمانی، هلند و اسپانیایی است.

این نسخه (BASE-large) با پشتیبانی از 980 میلیون پارامتر، ظاهرا بزرگ‌ترین مدل در نوع خود محسوب می‌شود. همچنین این مدل اساساً یک تقلید کننده صدا نیست، بلکه با وجود ویژگی‌های نوظهور خود می‌تواند حتی در صورت مواجه‌شدن با جملات پیچیده، در زمینه ارائه گفتار با صدای طبیعی، بهترین عملکرد را داشته باشد. آمازون همچنین مدل‌های 400 و 150 پارامتری مدل خود را براساس 10 هزار و 1000 ساعت صدا آموزش داده است.

نمونه تولید‌شده توسط مدل هوش مصنوعی تبدیل متن به گفتار آمازون

در وب‌سایتی که برای این مدل ساخته شده است، چندین نمونه صدا وجود دارد که توسط این هوش مصنوعی براساس برخی متون دشوار ایجاد شده است. در ادامه یک مورد از این صداها را م‌ی‌توانید گوش دهید.

باید به این نکته توجه داشت که این مدل هنوز در مرحله فرایند تجربی خود قرار دارد و برای اهداف تجاری یا موارد مشابه نمی‌توان از آن استفاده کرد. در تحقیقات بعدی احتمالاً توضیحات بیشتری درباره توانایی‌های نوظهوری و همچنین نحوه آموزش و استقرار مدل اعلام خواهد شد.

هرچند منابع و داده‌های مورداستفاده در BASE TTS به دلایل امنیتی فاش نشده است، اما عملکرد چشمگیر این مدل نشانه‌های روشنی از پیشرفت حوزه هوش مصنوعی است.

مرتبط پست ها

اخبار تکنولوژی

کدام قابلیت اندروید ۱۷ هیجان انگیز است؟

۰۴ خرداد ۱۴۰۵
اخبار تکنولوژی

بدافزارهای جاسوسی چه بلایی سر گوشی شما می‌آورند؟

۰۴ خرداد ۱۴۰۵
اخبار تکنولوژی

رسوایی جدید «ترامپ موبایل»/ اطلاعات شخصی خریداران لو می‌رود!

۰۳ خرداد ۱۴۰۵
اخبار تکنولوژی

جنس بدنه آیفون تغییر خواهد کرد

۳۱ اردیبهشت ۱۴۰۵

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

12 + 1 =

جدیدترین اخبار دانش جوین

  • معرفی 8 نرم افزار با عملکردی مشابه انی دسک و تیم وویور برای کار ریموت دسکتاپ
  • حمایت پیروز قربانی از مصاحبه ضد پرسپولیسی بختیاری زاده
  • نیمار بازی اول جام جهانی را از دست داد
  • حاشیه تازه برای تیم ملی / پای فیفا وسط کشیده شد
  • قیمت‌ها در بوداپست منفجر شد / هزینه یک شب اقامت به ۹ هزار یورو رسید
  • سقوط سهام فراری در پی رونمایی از منفورترین خودرو برقی تاریخ
  • ماشین لباسشویی جدید شیائومی میجیا پرو با قابلیت لکه‌بری فوق‌پیشرفته و سیستم‌عامل هایپر او اس معرفی شد
  • پنکه قابل حمل شیائومی Mijia با عمر باتری 40 ساعته معرفی شد
  • چراغ سبز کلوپ به الاتحاد / بمب بزرگ لیگ عربستان در راه است؟

جدیدترین نظرات مخاطبان

  • کارشناس روابط عمومی در ۸ سایت برتر خرید و فروش ووچر در ایران
  • بهزادی در ۸ سایت برتر خرید و فروش ووچر در ایران
  • کارشناس روابط عمومی در بهترین ساعات روز برای ترید طلا و جفت ارزها کدامند؟
  • کارشناس روابط عمومی در چطور از میکروسکوپ خود بهتر استفاده کنیم؟ راهنمای افزایش سرعت و دقت در کار و آموزش
  • امیر زارع در چطور از میکروسکوپ خود بهتر استفاده کنیم؟ راهنمای افزایش سرعت و دقت در کار و آموزش

دانش‌جوین یک مجله فارسیِ علم و فناوری است که از سال ۱۳۹۹ فعالیت می‌کند و به‌صورت تخصصی خبرها، تحلیل‌ها و مقالات به‌روز در حوزه‌هایی مثل تکنولوژی، گیمینگ، آی‌تی، هوش مصنوعی و حتی اقتصاد، سیاست و جامعه را گردآوری و منتشر می‌کند.

  • تماس و ارتباط
  • درباره دانش جوین
  • شرایط بازنشر
  • حریم شخصی کاربران
  • تبلیغات

تازه‌های دانش جوین

  • معرفی 8 نرم افزار با عملکردی مشابه انی دسک و تیم وویور برای کار ریموت دسکتاپ
  • حمایت پیروز قربانی از مصاحبه ضد پرسپولیسی بختیاری زاده
  • نیمار بازی اول جام جهانی را از دست داد
  • پاسینیک
  • تابلو لایت باکس
  • خرید سرور hp
  • کاغذ A4
  • خرید سرور اچ پی از ولکان سرور
  • خرید سرور ایران

تمامی حقوق برای دانش جوین محفوظ بوده و کپی از آن پیگرد قانونی خواهد داشت.

خوش آمدید!

به حساب خود در زیر وارد شوید

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای بازنشانی رمز عبور خود وارد کنید.

ورود به سیستم
بدون نتیجه
مشاهده تمام نتایج
  • تازه‌های تکنولوژی
  • بازی‌های رایانه‌ای
  • فناوری اطلاعات
    • سخت افزار
    • موبایل
    • اینترنت
      • هک و امنیت سایبری
  • هوش مصنوعی
  • دانش اقتصادی
    • صنعت و تجارت
    • دانش معماری
    • حمل و نقل
      • خودرو
    • ارزدیجیتال
  • دانش سیاسی
    • بین المللی
      • گردشگری و مهاجرت
  • دانش اجتماعی
    • دانشگاه
    • دانش حقوقی
    • دانش پزشکی
      • ورزش
      • محیط زیست
  • وب‌جوین
    • همیار آی تی
    • وب کده
    • دستکش لاتکس

تمامی حقوق برای دانش جوین محفوظ بوده و کپی از آن پیگرد قانونی خواهد داشت.