تفاجأ العديد من العاملين في مجال التسجيل الصوتي خلال الفترة الأخيرة بوجود نسخ تسجيلات صوتية بأصواتهم في العديد من المواقع الإلكترونية وهم لم يسجلوها قط، وذلك بسبب انتشار أدوات الذكاء الاصطناعي التي سهلت استنساخ الأصوات، وفقاً لموقع aitnews.
فنتيجة لتقدم الذكاء الاصطناعي التوليدي؛ وجد العاملون في مجال التسجيل الصوتي أنفسهم أمام تهديد حقيقي، إذ توجد الآن أدوات مجانية عبر الإنترنت يمكن من خلالها تسجيل أي نص صوتيًا، وبعضها يستخدم أصوات المشاهير أو الشخصيات السينمائية والتلفزيونية غالبًا بدون إذنهم.
وقد أفاد تقرير لصحيفة بلومبيرج أن بعض العاملين في مجال التسجيل الصوتي صُدموا عندما اكتشفوا أن أصواتهم تُستخدم في محتوى لم يشاركوا فيه، وعلموا لاحقًا أن شروط عقدهم كانت غير واضحة وغير محددة بما يكفي لتغطية مثل هذه الاستخدامات.
تعتمد بعض الشركات على صوت الأيرلندية (ريمي ميشيل كلارك) Remie Michelle Clarke، حيث تجد صوتها في إعلانات Mazda و Mastercard، كما تستخدم مايكروسوفت صوتها في محرك البحث بينج في أيرلندا، ولكن في يناير الماضي أخبرها مهندس الصوت الذي تعمل معه أنه وجد صوتًا يبدو مثل صوتها في موقع لتحويل النص إلى كلام يُسمى (Revoicer) ولكنه يُنسب إلى امرأة تدعى أوليفيا.
وفي مقابل رسوم شهرية متواضعة، يمكن لعملاء Revoicer الوصول إلى مئات الأصوات الاحترافية، ومن خلال أداة تستند في عملها إلى الذكاء الاصطناعي يمكن لهذه الأصوات تسجيل أي نص مكتوب خلال دقائق، ويمكن أن يستخدم هذا التسجيل في أي شيء سواء في الإعلانات أو التدريبات أو الرسائل الصوتية أو الكتب الصوتية.
وعندما تواصلت صحيفة بلومبيرج مع موقع (Revoicer) للسؤال عن وجود صوت (ميشيل كلارك) بدون علمها، جاءت الإجابة أنهم لا يستطيعون نشر كيفية حصولهم على بياناتها الصوتية، لكن العملية كانت قانونية تمامًا.
وقالت ميشيل كلارك إنها لا تعرف كيف يمكن للمواقع الإلكترونية بيع صوتها بشكل قانوني، ولكنها قلقة من أن العقد الذي وقعته منذ سنوات مع شركة مايكروسوفت قد يكون سبب وجود صوتها هكذا عبر المواقع الإلكترونية.
فمن خلال سياسة مشاركة البيانات مع شركات التكنولوجيا، يحق للعديد من الشركات استخدام أصوات الأشخاص الذين يتعاملون مع شركات التكنولوجيا في أدوات الذكاء الاصطناعي التي يطورها، وسيصبح الأمر قانونيًا تمامًا.
تتساءل ميشيل كلارك؛ كم عدد الشركات الأخرى التي تستخدم صوتي وعملي دون أخذي في الاعتبار؟ الآن لماذا ستدفع شركة 2000 دولار لتسجيل 30 ثانية بصوتي، بينما يمكنها بدلًا من ذلك دفع 27 دولارًا شهريًا مقابل استنساخه؟
بالإضافة إلى ذلك؛ أوضح تقرير لصحيفة الجارديان، أن تركيب الصوت في ألعاب الفيديو يوضح الآن مدى تأثير تطور الذكاء الاصطناعي التوليدي في هذه الصناعة. فعلى سبيل المثال عندما طُورت لعبة (Red Dead Redemption 2) عام 2013، استغرق الأمر 2200 يوم لتسجيل 1200 صوت في اللعبة عبر 700 ممثل صوتي، قاموا بقراءة 500 ألف سطر من الحوار المكتوب.
وقد اُعتبر ذلك إنجازًا هائلًا وقتها، ولكن الآن مع التقدم في الذكاء الاصطناعي التوليدي، أصبح من السهل إعادة إنشاء الأصوات البشرية لتقديم استجابات آلية لحظية، بالإضافة إلى توفر خيارات حوار غير محدودة تقريبًا وخطاب مصمم خصوصًا لمدخلات المستخدم الفريدة، لكن هذه التكنولوجيا تثير تساؤلات بشأن أخلاقيات تركيب الأصوات.
فقد طرحت شركة (Replica Studios) الأسترالية لتطوير الألعاب في عام 2019 أداة تعتمد على الذكاء الاصطناعي لتسجيل الأصوات في الألعاب، وقامت الشركة بترخيص أصوات 120 ممثلًا لاستخدامها في ألعاب الفيديو.
قال (شرياس نيفاس) Shreyas Nivas الرئيس التنفيذي لشركة (Replica Studios): “نأمل أن يكون هناك المئات، إن لم يكن الآلاف من الإستديوات التي يمكن أن تنجز ألعابًا مثل: (Red Dead Redemption 2)؛ لأن الجميع يريد القيام بذلك، ولكن تسجيل كل سطر من الحوار على حدة غير فعّال للغاية من منظور التكلفة والوقت، ويحتاج إلى وجود فرق ضخمة”.
ويرى نيفاس أن تركيب الصوت باستخدام الذكاء الاصطناعي هو المستقبل، ولكن كما هو الحال مع العديد من التطورات في هذا المجال، فإن هناك معضلات أخلاقية.
وفي اليابان؛ عقدت جمعية عمال الفنون المسرحية مؤتمرًا صحفيًا في وقت سابق من هذا الشهر، أثارت خلاله مخاوف بشأن تأثير الذكاء الاصطناعي في التمثيل الصوتي والموسيقى. ودعت المجموعة التي تضم نحو 52 ألف عامل إلى تشريعات لحماية وظائفهم.
تم أضافة تعليقك سوف يظهر بعد المراجعة