رویداد I، O 2025
رونمایی از هوش مصنوعی ویدئوساز گوگل
به گزارش سایت شیک، مدل هوش مصنوعی «Veo 3» گوگل می تواند ویدئوهایی با صدا تولید نماید.
به گزارش سایت شیک به نقل از ایسنا، شرکت گوگل بعنوان بخشی از اعلامیه های سال جاری خود در کنفرانس توسعه دهندگان I/O، جدید ترین مدلهای رسانه ای خویش را معرفی کرده است که قابل توجه ترین آنها شاید «Veo 3» باشد که نخستین نسخه از این مدل است که می تواند ویدئوهایی با صدا تولید نماید.
برای نمونه، می تواند ویدئویی از پرندگان با صدای آوازشان یا یک خیابان شهری با صدای ترافیک در پس زمینه ایجاد نماید.
گوگل می گوید «Veo 3» همینطور در تجسم فیزیک دنیای واقعی و در همگام سازی لب ها عملکرد خوبی دارد.
هم اکنون، این مدل فقط برای مشترکین Gemini Ultra در ایالات متحده در برنامه جمینای(Gemini) و برای کاربران سازمانی در «Vertex AI» در دسترس می باشد. همینطور در «Flow» (ابزار جدید ساخت فیلم هوش مصنوعی گوگل) هم در دسترس می باشد.
ابزار «Flow»، مدل Veo، Imagen و Gemini را برای ساختن کلیپ ها و صحنه های سینمایی گرد هم می آورد. کاربران می توانند خروجی نهائی را که می خواهند به زبان طبیعی توصیف کنند و «Flow» دست به کار خواهد شد تا آنرا برای آنها بسازد.
این ابزار جدید هم اکنون فقط برای مشترکین گوگل AI Pro و Ultra در ایالات متحده در دسترس خواهد بود، اما گوگل می گوید که بزودی در کشورهای بیشتری عرضه خواهد شد.
در حالیکه این شرکت یک مدل کاملا جدید تولید کننده ویدئو را منتشر نموده است، اما هنوز «Veo 2» را رها نکرده است. کاربران می توانند تصاویری از افراد، صحنه ها، سبک ها و اشیاء به «Veo 2» بدهند تا بعنوان مرجع برای خروجی مورد نظر خود در «Flow» استفاده نمایند. آنها به کنترل های دوربین دسترسی خواهند داشت که به آنها اجازه می دهد صحنه ها را بچرخانند و روی اشیاء خاص برای «Flow» بزرگنمایی کنند.
بعلاوه، اگر بخواهند می توانند فریم های خویش را از عمودی به افقی تغییر دهند و اشیاء را از ویدیوهای خود اضافه یا حذف نمایند.
گوگل همینطور آخرین مدل تولید کننده تصویر خود موسمو به «Imagen 4» را در این مراسم معرفی نمود. این شرکت گفت «Imagen 4» جزئیات ظریفی مانند پیچ و تاب پارچه ها و خز حیوانات را با شفافیت قابل توجه نشان داده است و در تولید تصاویر فوتورئالیستی و انتزاعی برتری دارد.
همینطور می تواند تصاویری در نسبت های مختلف با وضوح تا 2K ایجاد نماید.
مدل «Imagen 4» حالا از راه برنامه Gemini، Vertex AI و در برنامه های Workspace همچون Docs و Slides در دسترس می باشد.
گوگل همینطور اعلام نمود که بزودی نسخه ای از «Imagen 4» را که 10 برابر سریعتر از «Imagen 3» است، منتشر خواهد نمود.
در نهایت، گوگل جهت کمک به مردم برای شناسایی محتوای ساخته شده توسط هوش مصنوعی که اینروزها سخت تر از هر زمانی شده است، ابزار «SynthID Detector» را راه اندازی کرده است که پورتالی است که در آن کاربران می توانند قطعه ای از یک محتوای رسانه ای را که فکر می کنند با هوش مصنوعی ساخته شده است، آپلود کنند و گوگل تعیین می کند که آیا کار هوش مصنوعی است یا خیر.
منبع: سایت شیك
این مطلب سایت شیک را می پسندید؟
(1)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب