في مثل هذا الوقت من العام الماضي ، اشتعلت وسائل التواصل الاجتماعي بتكنولوجيا “الحنين العميق” من MyHeritage ، والتي أعاد سحر الذكاء الاصطناعي صورنا العائلية القديمة إلى الحياة بواقعية خارقة. حسنًا ، إذا أصابك ذلك بالفزع ، فانتظر حتى ترى الميزة الجديدة التي أطلقها للتو قصة حية.
هذه المرة ، لا تقوم تقنية شركة الأنساب عبر الإنترنت بإنشاء مقطع قصير من 10 إلى 20 مقطعًا استنادًا إلى صورة قديمة لقريبك. بدلاً من ذلك ، يأخذ LiveStory خطوة إلى الأمام من خلال إنشاء مقطع فيديو متحرك أطول لسلفك يروي قصة حياته الكاملة ، مع صوت متزامن مع الشفاه وعرض شرائح للصور القديمة.
كما كان من قبل ، فهو يعمل باستخدام تقنية “إعادة البناء” التي تعمل بالذكاء الاصطناعي والتي تقوم بتحريك صورة لوجه من تحب. ولكن هذه المرة أيضًا تحصل على صوت يتم إنشاؤه تلقائيًا من شجرة عائلة MyHeritage أو يتم إدخاله يدويًا بنفسك. تعمل تقنية تحويل النص إلى كلام على إضفاء الحيوية على القصة وتتم مزامنة الصوت مع الرأس الناطق المتحرك لوالدك.
كيف تعمل؟
مثل تقنية “Deep Nostalgia” للعام الماضي ، يتم إنشاء الرسوم المتحركة لـ LiveStory باستخدام عدد كبير من “مقاطع الفيديو التجريبية”. بعد أن تحلل خوارزميات الخدمة الصورة التي قمت بتحميلها ، يتم بعد ذلك تعيين ميزاتها البارزة أو “معالم” الوجه على فيديو السائق لخلق انطباع بالحركة. تملأ الخوارزميات أيضًا التفاصيل المفقودة. ينشئ مولد الصوت الاصطناعي أيضًا سردًا بناءً على المعلومات الموجودة في ملف تعريف الشخص ، أو يمكنك إنشاء نص خاص بك من البداية. يمكنك أيضًا تحميل التسجيل الصوتي الخاص بك.
تقول MyHeritage و D-ID ، الشركة الإسرائيلية التي تنشئ وترخص التكنولوجيا ، إن النتيجة النهائية قابلة للتخصيص بالكامل ، مما يمنحك خيار تحرير القصة والصور والصوت قبل إرسالها إلى العائلة أو الشبكات الاجتماعية. يبدو أن LiveStory يدعم أيضًا 31 لغة وعشرات اللهجات ومئات الشخصيات الصوتية ، بالإضافة إلى العديد من خيارات الصوت للذكور والإناث.
على الرغم من كل ذلك ، ليس هناك شك في أن التكنولوجيا مخيفة بعض الشيء وتأخذنا في رحلة أكبر إلى الوادي الغريب. بالنسبة للبعض ، قد تكون إضافة الصوت بعيدة جدًا ، وكان على MyHeritage إضافة بعض إخلاء المسؤولية للتأكد من عدم إساءة استخدام التكنولوجيا. ويقول إن LiveStory “مخصص للاستخدام فقط في صور الأشخاص المتوفين ، وعادة ما يكون أسلافهم” وأنه “لا ينبغي أبدًا استخدامه على صورة شخص على قيد الحياة دون إذنه”.
ومع ذلك ، وجد الكثير على وسائل التواصل الاجتماعي أن تقنية “الحنين العميق” العام الماضي كانت طريقة مريحة أو حتى دافئة للقبض على علاقات لم يروها من قبل في الحياة الواقعية. ومثل هذه الميزة ، فإن LiveStory متاح حاليًا للتجربة مجانًا على سطح المكتب والويب المحمول (كلاهما عبر موقع MyHeritage الإلكتروني) وفي تطبيق MyHeritage للجوال. يمكنك إنشاء قصص LiveStories متعددة مجانًا ، ولكن بعد ذلك ستحتاج إلى الدفع مقابل اشتراك (من 119 دولارًا / 89 جنيهًا إسترلينيًا سنويًا).
التحليل: خطوة أكثر جرأة في الوادي الغريب
إلى حد كبير مثل “الحنين العميق” العام الماضي ، نحن ممزقون قليلاً بشأن ميزة “LiveStory” الجديدة في MyHeritage. ليس هناك شك في أن التكنولوجيا رائعة ، وحقيقة أنها يمكن أن تنشئ تلقائيًا سيرة فيديو مدتها 90 ثانية من صورة وشجرة عائلة ونص أمر مذهل ومخيف.
ومع ذلك ، لا يسعنا إلا أن نعتقد أن الكثير من النجاح الفيروسي السابق للتكنولوجيا (والذي أدى إلى 100 مليون رسم متحرك) كان بسبب دقتها. كانت الوجوه المتحركة التي أنتجها فيلم “Deep Nostalgia” تومض أحيانًا أو تومئ برأسها ، ولكن هذا هو الحال – وقد ساعد هذا التقييد في خلق وهم أثناء إخفاء قيود التكنولوجيا.
تعد إضافة الصوت خطوة منطقية ، وليس لدينا شك في أنها ستثبت أنها أداة شائعة لأولئك الذين لا يصابون بقشعريرة عامل الزحف الذي لا يمكن إنكاره. ولكن من الأمثلة التي رأيناها حتى الآن ، فإن التنغيم يكون أحيانًا آليًا ، وحقيقة أن الصوت لا يتم أخذ عينات من الشخص الأصلي يجعله يبدو مفتعلًا بعض الشيء.
في الوقت الحالي ، يبدو أن LiveStory أكثر ملاءمة للمتاحف أو التعليم ، حيث قد تكون قدرته على إعادة الحياة إلى الشخصيات التاريخية (بدلاً من العلاقات الشخصية) وسيلة مفيدة لجعل التاريخ أكثر جاذبية للزوار والأطفال.
بالطبع ، هناك أيضًا خطر إساءة الاستخدام ، على الرغم من أن D-ID (صانع التكنولوجيا) قد أنشأ حواجز حماية لمنع حدوث ذلك. يجب أن يوافق جميع المستخدمين على الشروط ، بما في ذلك الوعد بأنهم لن يستخدموها مع أشخاص أحياء ، قبل أن يتمكنوا من إنشاء LiveStory. هناك أيضًا خوارزمية تعديل النص على متن الطائرة للتحقق من المعلومات الهجومية أو التشهيرية أو الكاذبة ، على الرغم من أنه من غير الواضح كيف يتم التحقق من هذه الأخيرة.
متي تحدثنا إلى D-ID العام الماضي في مقابلة حصرية، لقد خرجنا متأثرين بالتزامه بضمان عدم استخدام تقنية الذكاء الاصطناعي الخاصة به بطريقة شائنة ، على الرغم من أنه أيضًا غير مستقر إلى حد ما بسبب توقعه أن غالبية الوسائط المرئية التي نراها على الإنترنت ستكون اصطناعية “في غضون 5 إلى 10 سنوات. ” من الواضح أن LiveStory هي خطوة أخرى على هذا المسار ، إن لم تكن النتيجة الفيروسية لـ “Deep Nostalgia” العام الماضي.