گوگل جمینای و Veo را ادغام میکند
دمیس هاسابیس، مدیرعامل گوگل دیپمایند از برنامههای این شرکت برای ادغام مدلهای جمنای و Veo خبر داد تا درک هوش مصنوعی از دنیای فیزیکی بهبود یابد.

دمیس هاسابیس، مدیرعامل گوگل دیپمایند، در قسمتی از پادکست Possible به میزبانی یکی از بنیانگذاران لینکدین، اعلام کرد که گوگل قصد دارد مدلهای هوش مصنوعی جمینای را با مدلهای ساخت ویدیو Veo ادغام کند تا درک مدلهای قبلی از دنیای فیزیکی بهبود یابد.
مدیرعامل دیپمایند توضیح میدهد که جمنای از ابتدا با هدف چندوجهیبودن طراحی شد و این تصمیم بهدلیل چشمانداز گوگل برای ایجاد یک دستیار دیجیتال جهانی اتخاذ شده است؛ دستیار دیجیتالیای که بتواند در دنیای واقعی به کاربران کمک کند.
صنعت هوش مصنوعی بهطور تدریجی به سمت مدلهای «همهکاره» پیش میرود؛ مدلهایی که قادر به درک و ترکیب اشکال مختلف محتوا هستند. مدلهای جمنای گوگل قادر به تولید صدا، تصویر و متن هستند، از سوی دیگر مدل GPT-4o از OpenAI نیز میتواند تصویر ایجاد کند.
همچنین بخوانید: کلاهبرداری میلیونی با هوش مصنوعی
ایجاد چنین مدلهایی نیازمند دادههای آموزشی فراوان است؛ از جمله تصویر، ویدیو صدا و متن. هاسابیس اشاره کرده که دادههای ویدیویی Veo عمدتاً از یوتیوب استخراج میشوند.
هاسابیس میگوید که با مشاهدهی تعداد زیادی ویدیو در یوتیوب، Veo 2 میتواند مفاهیمی چون قوانین فیزیکی جهان را شناسایی کند.
گوگل پیشتر گفته بود که مدلهایش ممکن است با «برخی» محتواهای یوتیوب، مطابق توافقنامهای با خالقان محتوا، آموزش ببینند. گفته میشود گوگل سال گذشته شرایط خدمات خود را گسترش داد تا امکان دسترسی بیشتر به دادههای یوتیوب برای آموزش مدلهای هوش مصنوعیاش فراهم شود.
منبع: زومیت