گوگل جمینای و Veo را ادغام می‌کند

دمیس هاسابیس، مدیرعامل گوگل دیپ‌مایند از برنامه‌های این شرکت برای ادغام مدل‌های جمنای و Veo خبر داد تا درک هوش مصنوعی از دنیای فیزیکی بهبود یابد.

ظهیر کیانی۲۲ فروردین ۱۴۰۴آخرین بروزرسانی: ۲۲ فروردین ۱۴۰۴

مدیرعامل گوگل دیپ‌مایند از ادغام مدل‌های جمینای و Veo در آینده خبر داد.

دمیس هاسابیس، مدیرعامل گوگل دیپ‌مایند، در قسمتی از پادکست Possible به میزبانی یکی از بنیان‌گذاران لینکدین، اعلام کرد که گوگل قصد دارد مدل‌های هوش مصنوعی جمینای را با مدل‌های ساخت ویدیو Veo ادغام کند تا درک مدل‌های قبلی از دنیای فیزیکی بهبود یابد.

مدیرعامل دیپ‌مایند توضیح می‌دهد که جمنای از ابتدا با هدف چندوجهی‌بودن طراحی شد و این تصمیم به‌دلیل چشم‌انداز گوگل برای ایجاد یک دستیار دیجیتال جهانی اتخاذ شده است؛ دستیار دیجیتالی‌ای که بتواند در دنیای واقعی به کاربران کمک کند.

صنعت هوش مصنوعی به‌طور تدریجی به سمت مدل‌های «همه‌کاره» پیش می‌رود؛ مدل‌هایی که قادر به درک و ترکیب اشکال مختلف محتوا هستند. مدل‌های جمنای گوگل قادر به تولید صدا، تصویر و متن هستند، از سوی دیگر مدل GPT-4o از OpenAI نیز می‌تواند تصویر ایجاد کند.

همچنین بخوانید: کلاهبرداری میلیونی با هوش مصنوعی

ایجاد چنین مدل‌هایی نیازمند داده‌های آموزشی فراوان است؛ از جمله تصویر، ویدیو صدا و متن. هاسابیس اشاره کرده که داده‌های ویدیویی Veo عمدتاً از یوتیوب استخراج می‌شوند.

هاسابیس می‌گوید که با مشاهده‌ی تعداد زیادی ویدیو در یوتیوب، Veo 2 می‌تواند مفاهیمی چون قوانین فیزیکی جهان را شناسایی کند.

گوگل پیش‌تر گفته بود که مدل‌هایش ممکن است با «برخی» محتواهای یوتیوب، مطابق توافق‌نامه‌ای با خالقان محتوا، آموزش ببینند. گفته می‌شود گوگل سال گذشته شرایط خدمات خود را گسترش داد تا امکان دسترسی بیشتر به داده‌های یوتیوب برای آموزش مدل‌های هوش مصنوعی‌اش فراهم شود.

منبع: زومیت

ظهیر کیانی۲۲ فروردین ۱۴۰۴آخرین بروزرسانی: ۲۲ فروردین ۱۴۰۴