גוגל היא אחת מתאגידי הטכנולוגיה שהיו פעילות מאוד במרוץ לפיתוח כלי בינה מלאכותית (AI), כולל הצ'אטבוט ג'מיני שיתחרה ב-ChatGPT או בכלי יצירת התמונות מבוסס הטקסט Imagen. עם זאת, היכולת של גוגל ליצור סרטונים מטקסט תיאורי עדיין נחשבת על ידי קהילת הטכנולוגיה כנחותה בהרבה מזו של מתחרותיה.
לאחרונה, גוגל הציגה רשמית את כלי תמיכת המשתמשים Gemini Advanced להמרת טקסט לסרטונים ברזולוציה גבוהה באורך של 8 שניות. במקביל, נפרסה גם תכונת Whisk Animate עם היכולת להפוך תמונות סטטיות לסרטוני אנימציה עזים באורך דומה. שתי התכונות הללו זמינות כעת למשתמשים המנויים ל-Google One AI Premium.
גוגל טוענת ש-Veo 2 מסמן קפיצת מדרגה ביצירת וידאו, שנועד לייצר סרטונים ברזולוציה גבוהה, מפורטים, מציאותיים וקולנועיים. Veo 2, הלוכד פיזיקה אמיתית ותנועה אנושית, יכול ליצור תנועות דמויות זורמות, סצנות דינמיות ופרטים מרהיבים במגוון רחב של נושאים וסגנונות.
כדי ליצור סרטון, על המשתמשים לבחור את Veo 2 מתפריט המודלים ב-Gemini (מיקום אפשרות זו בממשק עשוי להשתנות במהלך הפיתוח). תכונה זו תיצור סרטון באורך 8 שניות ברזולוציה של 720p, המיוצא כפורמט MP4 עם יחס גובה-רוחב של 16:9. גוגל מציינת גם שמשתמשים יכולים להגדיר מגבלה על מספר הסרטונים שהם יכולים ליצור בחודש.
משתמשים פשוט מתארים את הסצנה שהם מדמיינים, בין אם זה סיפור קצר, רעיון ויזואלי או סצנה ספציפית. ג'מיני מחייה את הרעיונות האלה. ככל שהתיאור של המשתמש מפורט יותר, כך הסרטון הסופי יהיה טוב יותר.
גוגל טוענת שמשתמשים יכולים לשתף בקלות סרטונים שנוצרו על ידי Veo 2 בפלטפורמות מדיה חברתית כמו TikTok או YouTube Shorts. עם זאת, לסרטונים שנוצרו על ידי Veo 2 יש יחס גובה-רוחב של 16:9, שאינו מתאים כלל לשיתוף בפלטפורמות וידאו אלו.

תכונת יצירת הסרטונים זמינה כעת למשתמשי Gemini Advanced ברחבי העולם, הן באינטרנט והן בנייד. עם זאת, היא זמינה רק למי שנרשם לתוכנית Google One AI Premium, כאשר תמיכה מלאה בשפות זמינה ב-Gemini.
נכון לעכשיו, Veo 2 מסופק על ידי גוגל למשתמשי Gemini Advanced, עם מחיר שירות של 489,000 דונג וייטנאם לחודש.
בנוסף ל-Veo 2, גוגל השיקה גם כלי בינה מלאכותית בשם Whisk Animate, המאפשר למשתמשים ליצור תמונות חדשות עם טקסט תיאורי, ולאחר מכן להפוך את התמונה הזו לסרטון עם תנועה חלקה, אך גם אורכו המרבי הוא 8 שניות בדומה ל-Veo 2.
Whisk, ניסוי של Google Labs שיושק בסוף 2024, עוזר למשתמשים לחקור ולהמחיש רעיונות חדשים במהירות באמצעות הנחיות טקסט ותמונה. משתמשים יכולים להפיח חיים ברעיונותיהם בעזרת התכונה Whisk Animate.
Whisk Animate מציע את היכולת להפוך תמונות סטילס של משתמשים לסרטונים חיים בני 8 שניות באמצעות טכנולוגיית Veo 2. התכונה זמינה למנויי Google One AI Premium ביותר מ-60 מדינות.

גוגל גם מסרה כי יישמה צעדים משמעותיים כדי להבטיח חוויית יצירת וידאו בטוחה. זה כולל צוותים אדומים (red teaming) ובדיקה מקיפה כדי למנוע יצירת תוכן המפר את מדיניות גוגל. בנוסף, כל סרטון שנוצר באמצעות Veo 2 מתויג ב-SynthID, סימן מים דיגיטלי המוטמע בכל פריים המציין בבירור שהוא נוצר על ידי בינה מלאכותית.
מקור: https://www.vietnamplus.vn/google-gioi-thieu-cong-cu-ai-chuyen-doi-van-ban-thanh-video-tu-gemini-advanced-post1033671.vnp
תגובה (0)