غوغل جادة جدًا في كل ما يتعلق بالذكاء الاصطناعي. خلال مؤتمر Google I/O 2024، عرضت Gemini Pro 1.5 و Project Astra ومجموعة كبيرة من الميزات المستندة إلى الذكاء الاصطناعي والتي ستتوفر في محرك البحث قريبًا.
الآن، إحدى النقاط الأكثر إثارة للاهتمام التي أظهروها خلال هذا الحدث هي Imagen 3 وVeo و Music AI Sandbox. ما مجموعه 3 أدوات تريد غوغل من خلالها تحدي OpenAI بشكل مباشر، وبشكل أكثر تحديدًا Sora، الذكاء الاصطناعي الخاص بإنشاء الفيديو.الأولى تهدف بشكل أساسي إلى تقديم صور أفضل للذكاء الاصطناعي بناءً على المطالبات النصية. ستكون الأداة قادرة على جمع العناصر الأساسية للطلب بشكل أفضل لتقديم صورة أكثر دقة.
بالإضافة إلى ذلك، تفهم أداة Imagen 3 اللغة الطبيعية للطلب والغرض منه بشكل أفضل، بالإضافة إلى مراعاة التفاصيل الصغيرة للطلبات الطويلة، مما يجعلها تتقن الأساليب المختلفة.
أما الثانية Veo فهي أداة مخصص لكل ما يتعلق بالفيديو. ومن خلال سلسلة من المطالبات النصية، ستتمكن الأداة من تقديم مقطع فيديو وفقًا لتلك الطلبات.
أثناء العرض يمكنك معرفة عدد من الأشياء المطلوبة منها ، مثل إنشاء مشهد متحرك على النمط الغربي حيث يمكنك رؤية حذاء رعاة البقر وهو يتحرك أو لقطة قريبة لشخص ما، والحقيقة هي أن النتائج مفاجئة.
تشير غوغل إلى أن الأداة قادرة على إنتاج مقاطع فيديو عالية الجودة بدقة 1080 بكسل ويمكنها تقديم تنوع كبير في الأنماط المرئية والسينمائية.
بالإضافة إلى ذلك، فهي تتميز بتحليل متقدم للغة طبيعية ودلالات مرئية، ويمكنها تحويل الطلبات إلى مقاطع فيديو تمثل الرؤية الإبداعية للمستخدم، وتقديم التفاصيل بدقة في الطلبات الطويلة .
والثالثة وهي أداة Music AI Sandbox ، سيتم تصميمها لمساعدة الموسيقيين أو المطربين، وإنشاء قاعدة موسيقية أو المزيد من العناصر بناءً على المقطوعات الصوتية أو الإيقاعات التي يمكنك تقديمها للأداة.
إجمالي 3 أدوات تريد غوغل بوضوح مواصلة الاستثمار في الذكاء الاصطناعي من خلالها. الآن، في الوقت الحالي، لم يعطوا تاريخًا لطلاقها ، وعلى الرغم من أن الشركة قالت إن الأدوات الثلاثة ستصل قريبًا، إلا أنها لم تقدم تاريخًا محددًا، لذلك علينا الانتظار.
from حوحو للمعلوميات https://ift.tt/3eESo9K
محول الأكوادإخفاء محول الأكواد الإبتساماتإخفاء الإبتسامات