مدل های هوش مصنوعی Imagen 3 و Veo گوگل
پس از گذشت حدود 6 ماه از رونمایی رسمی پلتفرم Vertex AI گوگل سرانجام میزبان دو مدل جدید هوش مصنوعی این شرکت یعنی Imagen 3 و Veo شده است. این دو مدل می توانند به تنهایی کار کنند اما می توان با هم نیز استفاده شوند. اولی می تواند یک تصویر براساس یک دستور متنی ایجاد کند درحالی که دومی یک تصویر و یک پیام متنی را می گیرد و آن را متحرک می کند.

مدل های هوش مصنوعی Imagen 3 و Veo گوگل
وقتی صحبت از تسلط هوش مصنوعی مولد به میان می آید شرکت ها فعالانه به دنبال این هستند که خودشان را تثبیت کنند یا با کاوش مداوم قابلیت های جدید پیشرو باشند. OpenAI به طور گسترده ای رشد کرده است و به ارائه ارتقاء و نوآوری در مدل های خود ازطریق فناوری پیشرفته خود ادامه می دهد. بااین حال این شرکت به کاربران خود وعده یک مدل هوشمند برای ایجاد ویدیو Sora را داده است که هنوز عرضه نشده است. از سوی دیگر گوگل با راه اندازی Veo در پیش نمایش خصوصی انقلابی در تولید محتوا ایجاد کرده است.

مدل های هوش مصنوعی Imagen 3 و Veo گوگل
درحالی که OpenAI اولین کسی بود که در ماه فوریه از مدل ویدئویی هوش مصنوعی مولد خود یعنی همان Sora رونمایی کرد و حتی توانایی خود را برای ایجاد ویدئوهای 60 ثانیه ای ازطریق پیام های متنی به نمایش گذاشت گوگل اکنون با عرضه رقیب آن Veo در یک پیش نمایش خصوصی پیشتاز است.
گوگل مدل ویدئویی هوش مصنوعی خود را حدود سه ماه پس از آن که OpenAI مدل Sora را از متن به ویدئو نشان داد به نمایش گذاشت. در طول کنفرانس توسعه دهندگان I/O گوگل ادعا کرد که Veo دارای قابلیت های گسترده ای است که می تواند به تولید ویدیوهای با کیفیت در بیش از یک دقیقه کمک کند و کاربران می توانند از سبک های بصری و سینمایی متنوعی استفاده کنند.
درحالی که اطلاعات پراکنده ای در مورد اینکه آیا مدت زمان تولید ویدیو آن چیزی است که قبلاً در ویدیوها نشان داده شده است کلیپ های جدید ویدیوهای واقعی هوش مصنوعی قابل توجهی را نشان می دهند. ویدیوها از کیفیت بالایی برخوردار هستند و تشخیص آن را از فیلم واقعی بسیار دشوار می کند مگر اینکه کاربران با دقت زیاد به آن ها نگاه کنند.
مدل Imagen 3 گوگل نیز یک تولیدکننده هوش مصنوعی متن به تصویر به زودی در دسترس مشتریان Google Cloud قرار خواهد گرفت و هفته آینده به طور گسترده عرضه خواهد شد. ویژگی های جدید برای کاربرانی که در لیست مجاز ذکر شده اند نیز در دسترس خواهند بود و به آن ها امکان سفارشی سازی ویرایش سریع عکس یا حتی تغییر لوگوها یا عناصر برای تصاویر تولیدشده را می دهند.
گوگل همچنان تأکید می کند که مدل های Veo و Imagen 3 هر دو دارای محافظ های داخلی هستند که به جلوگیری از تخلفات کمک می کند و همچنین هرگونه محتوای نامناسب را مسدود می کند. بااین حال با آزمایش مشخص شد که دور زدن آن ها غیرممکن نیست. گفته می شود محتوای تولیدشده ازطریق مدل ها دارای یک واترمارک دیجیتال نامرئی است که با کمک فناوری SynthID DeepMind تولید می شود و تشخیص می دهد آیا محتوا درواقع توسط هوش مصنوعی تولیدشده است یا خیر.
با عرضه Veo مدل هوش مصنوعی ویدیویی توسط گوگل فشار بر OpenAI برای ارائه مدل Sora خود که کاربران مدت ها منتظر آن بودند و نزدیک به پایان سال 2024 وعده داده شده بود وارد می شود.
نظر شما درباره مدل های جدید هوش مصنوعی گوگل چیست؟
بفرست برای دوستات