تقدم Google علامة مائية غير مرئية للنصوص التي يتم إنشاؤها بواسطة الذكاء الاصطناعي

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

طور Google DeepMind علامة مائية غير مرئية للنص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي لمكافحة المعلومات الخاطئة.

Google DeepMind hat ein unsichtbares Wasserzeichen für KI-generierte Texte entwickelt, um Falschinformationen zu bekämpfen.
طور Google DeepMind علامة مائية غير مرئية للنص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي لمكافحة المعلومات الخاطئة.

تقدم Google علامة مائية غير مرئية للنصوص التي يتم إنشاؤها بواسطة الذكاء الاصطناعي

طور الباحثون في Google DeepMind في لندن "علامة مائية" لوضع علامة غير مرئية على النص الناتج عن الذكاء الاصطناعي (AI) - وقد تم استخدام هذا بالفعل من قبل الملايين من مستخدمي برامج الدردشة الآلية.

تم نشر العلامة المائية في 23 أكتوبر في مجلة Nature 1 ، ليس الأول الذي تم إنشاؤه للنصوص التي تم إنشاؤها بواسطة الذكاء الاصطناعي. ومع ذلك، فهو الأول من نوعه الذي يتم عرضه على نطاق واسع في سياق العالم الحقيقي. يقول سكوت آرونسون، عالِم الكمبيوتر بجامعة تكساس في أوستن، الذي كان يعمل حتى شهر أغسطس على وضع العلامات المائية في شركة OpenAI، التي تصنع ChatGPT ومقرها في سان فرانسيسكو، كاليفورنيا: "أعتقد أن أهم الأخبار هنا هو أنهم يستخدمونها فعليًا".

أصبح التعرف على النص الناتج عن الذكاء الاصطناعي ذا أهمية متزايدة لأنه يمثل حلاً محتملاً لمشاكل أخبار كاذبة و الاحتيال الأكاديمي يمثل. وبالإضافة إلى ذلك، يمكن أن تساهم في حماية النماذج المستقبلية من انخفاض قيمة العملة من خلال عدم تدريبها على محتوى تم إنشاؤه بواسطة الذكاء الاصطناعي.

في دراسة شاملة، قام مستخدمو Google Gemini Large Language Model (LLM) بتقييم النصوص التي تحمل علامة مائية على أنها تعادل النصوص غير المميزة في 20 مليون استجابة. وقال فورونج هوانج، عالم الكمبيوتر في جامعة ميريلاند في كوليدج بارك: "أنا متحمس لرؤية جوجل تتخذ هذه الخطوة لصالح مجتمع التكنولوجيا". ويضيف زاخار شوميلوف، عالم الكمبيوتر في جامعة كامبريدج بالمملكة المتحدة: "من المرجح أن تشتمل معظم الأدوات التجارية على علامات مائية في المستقبل القريب".

اختيار الكلمات

يعد تطبيق علامة مائية على النص أكثر صعوبة من تطبيقها على الصور لأن اختيار الكلمات هو في الأساس المتغير الوحيد الذي يمكن تغييره. تعمل العلامة المائية DeepMind - التي تسمى SynthID text - على تغيير الكلمات التي يختارها النموذج بطريقة سرية ولكن معادلة يمكن التقاطها باستخدام مفتاح التشفير. بالمقارنة مع الطرق الأخرى، فإن اكتشاف العلامة المائية لـ DeepMind أسهل قليلاً ولا يؤخر التطبيق إنشاء النص. يقول شومايلوف، وهو موظف سابق وشقيق أحد مؤلفي الدراسة: "يبدو أنها تتفوق على أساليب المنافسين في وضع العلامات المائية على حاملي شهادات الماجستير".

تم أيضًا فتح الأداة حتى يتمكن المطورون من تطبيق العلامة المائية الخاصة بهم على نماذجهم. يقول بوشميت كوهلي، عالم الكمبيوتر في شركة ديب مايند: "نأمل أن يتبنى مطورو نماذج الذكاء الاصطناعي الآخرون هذا الأمر ويدمجونه في أنظمتهم الخاصة". تحتفظ Google بسرها الرئيسي حتى لا يتمكن المستخدمون من استخدام أدوات الكشف لتحديد النص الذي يحمل علامة مائية من نموذج Gemini.

مجموعة الحكومات على العلامات المائية كحل لتوزيع النص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي. ومع ذلك، لا تزال هناك العديد من المشاكل، بما في ذلك التزام المطورين باستخدام العلامات المائية وتنسيق أساليبهم. وفي بداية هذا العام، أظهر باحثون في المعهد الفيدرالي السويسري للتكنولوجيا في زيورخ ذلك أي علامة مائية عرضة للإزالة هي عملية تسمى "التنظيف" أو "الانتحال"، حيث يتم تطبيق العلامات المائية على النص لإعطاء انطباع خاطئ بأنه تم إنشاؤه بواسطة الذكاء الاصطناعي.

البطولة الرمزية

يعتمد نهج DeepMind على واحد الطريقة الموجودة ، الذي يدمج العلامة المائية في خوارزمية أخذ العينات، وهي خطوة في إنشاء النص منفصلة عن LLM نفسها.

LLM عبارة عن شبكة من الارتباطات التي تم إنشاؤها عن طريق التدريب بمليارات الكلمات أو أجزاء من الكلمات المعروفة باسم الرموز المميزة. عند إدخال النص، يقوم النموذج بتعيين كل رمز مميز في مفرداته احتمالية أن تكون الكلمة التالية في الجملة. تتمثل مهمة خوارزمية أخذ العينات في اختيار الرمز المميز الذي سيتم استخدامه وفقًا لمجموعة من القواعد.

تستخدم خوارزمية أخذ عينات النص SynthID مفتاح تشفير لتعيين قيم عشوائية لكل رمز مميز ممكن. يتم سحب الرموز المميزة للمرشح من التوزيع بما يتناسب مع احتماليتها ووضعها في "البطولة". هناك، تقوم الخوارزمية بمقارنة القيم في سلسلة من جولات خروج المغلوب الفردية، مع الفوز بأعلى قيمة حتى يبقى رمز واحد فقط، والذي يتم اختياره للنص.

هذه الطريقة المتطورة تجعل اكتشاف العلامة المائية أسهل لأنه يتم تطبيق نفس رمز التشفير على النص الذي تم إنشاؤه للبحث عن القيم العالية التي تشير إلى الرموز المميزة "الفائزة". وهذا يمكن أن يجعل الإزالة صعبة أيضًا.

ويقول هوانغ إنه يمكن النظر إلى الجولات المتعددة في البطولة على أنها مزيج من القفل، حيث تمثل كل جولة رقمًا مختلفًا يجب حله لفتح العلامة المائية أو إزالتها. وتضيف: "هذه الآلية تزيد من صعوبة مسح العلامة المائية أو انتحالها أو إجراء هندسة عكسية لها". بالنسبة للنصوص التي تحتوي على حوالي 200 رمز، أظهر المؤلفون أنه لا يزال بإمكانهم اكتشاف العلامة المائية حتى عند استخدام ماجستير آخر لإعادة كتابة النص. تكون العلامة المائية أقل قوة بالنسبة للنصوص القصيرة.

ولم يفحص الباحثون مدى مقاومة العلامة المائية للمحاولات المتعمدة لإزالتها. يقول إيف ألكسندر دي مونتجوي، عالم الكمبيوتر في إمبريال كوليدج لندن، إن قدرة العلامات المائية على مقاومة مثل هذه الهجمات هي "مسألة سياسية ضخمة". ويوضح قائلاً: "في سياق أمن الذكاء الاصطناعي، ليس من الواضح إلى أي مدى يوفر هذا الحماية".

ويأمل كوهلي أن تساعد العلامة المائية في البداية في دعم الاستخدام حسن النية لبرامج LLM. ويضيف: "كانت الفلسفة التوجيهية هي أننا أردنا تطوير أداة يمكن للمجتمع تحسينها".

  1. داثاثري، S. وآخرون. طبيعة 634، 818-823 (2024).

    جوجل الباحث العلمي

تحميل المراجع