اختبار «تشات جي بي تي كانفاس»: تحسينات جذرية وصعوبات التطوير

الغلبة تبقى لتطبيقات الكتابة المجرّبة القديمة

اختبار «تشات جي بي تي كانفاس»: تحسينات جذرية وصعوبات التطوير
TT

اختبار «تشات جي بي تي كانفاس»: تحسينات جذرية وصعوبات التطوير

اختبار «تشات جي بي تي كانفاس»: تحسينات جذرية وصعوبات التطوير

يمكننا القول إن كلمة «تشات» في اسم «تشات جي بي تي» (ChatGPT)، توجز بدقة أحد الأسباب الرئيسة وراء التأثير الهائل للمساعد المدعوم بالذكاء الاصطناعي الذي طرحته شركة «أوبن إيه آي» (OpenAI)؛ إذ استعنا بالكومبيوترات والهواتف للدخول في دردشات مع آخرين طيلة سنوات... على الأقل، منذ ظهور «AOL Instant Messenger». وعليه، فإن إجراء دردشة مع برنامج، بالاعتماد على واجهة مشابهة إلى حد كبير، قد لا يبدو قفزة ذهنية كبرى.

ومع ذلك، فإن تركيز «تشات جي بي تي» على مسألة الدردشة ربما يشكل عثرة في طريقه بصورة ما، وذلك لأنه ليس من الممكن التعبير عن جميع المهام التي يحتاج إليها المرء، في صورة حوار مباشر بين طرفين.

من الدردشة إلى الكتابة

على سبيل المثال، تتطلب مهمة الكتابة تقنية أشبه بمعالج للكلمات، مع توفير مساحة واسعة لصياغة النص، والقدرة على إدخال التعديلات التي ترغب فيها. وهذه الحاجة لا تتغير لمجرد أنه تصادف تعاونك، في إنجاز مهمة الكتابة، مع مساعد يعمل بالذكاء الاصطناعي.

حديثاً، أطلقت «أوبن إيه آي» نسخة جديدة من «تشات جي بي تي» تضع في حسبانها هذا السيناريو. وحملت النسخة الجديدة اسم «تشات جي بي تي 4 أو» الذي يضم برنامج «كانفاس» (ChatGPT 4o with Canvas)، ما يُعدّ خياراً جديداً أمام المشتركين بقائمة نماذج «تشات جي بي تي بلس»، وهي قائمة جرى تصميمها مع وضع مسألة الكتابة والترميز في الاعتبار.

وللوهلة الأولى، قد يبدو الأمر أشبه بالشكل المعتاد لـ«تشات جي بي تي»، لكن إذا طلبت من هذا التطبيق كتابة شيء ما، ربما يقرر وضع النتائج داخل نافذة مستند كبيرة، ونقل الدردشة إلى اليسار. وإذا طرحت طلبات أخرى، فسيقوم بتحديث النافذة، بدلاً من البدء من جديد. ويتيح لك التطبيق تحرير النص بنفسك، أو تشغيل مستند فارغ وإدخال مواد خاصة بك، مثل شيء ترغب في تلخيصه. وهناك كذلك خيارات لصقل النص النثري، والتحقق من القواعد النحوية، وضبط مستوى القراءة، وتقصير النص أو إطالته.

تحسينات وصعوبات

وفيما يخص مهام الذكاء الاصطناعي المعتمدة بشدة على النصوص، يعمل «كانفاس» على إدخال تحسينات جذرية على واجهة «تشات جي بي تي» التقليدية. ومع ذلك، يبدو الأمر، حتى هذه اللحظة، غير مكتمل بعد، لا سيما أنني لم أتمكن من تشغيل أجزاء كبيرة منها في «سفاري» عبر جهاز «ماك» أو «آيباد». وفي مرحلة ما، التهم التطبيق على نحو غير مفهوم أجزاء من النص سبق أن لصقتها (لحسن الحظ، يمكنك العودة إلى نسخ سابقة).

ويمكن للبرنامج كذلك استخدام أدوات أساسية، على الأقل، للتعامل مع المستندات التي تنشئها، مثل القدرة على إعادة تسميتها ورؤيتها جميعاً في مكان واحد.

نظرياً، يسهم «كانفاس» في جعل «تشات جي بي تي» أقرب، من حيث الواجهة والوظائف، إلى أداة «غوغل إيه آي» المعروفة باسم «نوتبوك إل إم» (NotebookLM). يُذكر أن هذه الأداة أُطلقت أواخر العام الماضي، وتُعتبر أداة بحثية جرى تعزيز أدائها لخدمة الكتَّاب الذين تتضمن أعمالهم مواد مرجعية - ملفات نصية، مثل نصوص مقابلات وصفحات ويب وملفات «بي دي إف»، وحتى الملفات الصوتية. وبمجرد أن تدخل هذه العناصر في التطبيق، سيوجزها لك، ويجيب عن أسئلتك حولها، بل يقترح عليك أسئلة ينبغي لك طرحها.

مقارنات مع أدوات «غوغل»

بوجه عام، فإن كثيراً مما يمكنك إنجازه بالاعتماد على «نوتبوك إل إم»، يمكنك إنجاز نتائج قريبة منها بالاعتماد على أي روبوت دردشة يعمل بالذكاء الاصطناعي. ومع ذلك، لا يسعني إلا أن أبدي إعجابي بجودة ملخصاته، وقدرته على تحديد الحقائق ذات الصلة بسرعة أكبر مما يمكنني تحديده بنفسي. ومثلما الحال مع «تشات جي بي تي» مع «كانفاس»، تبقى الجوانب غير ذات الصلة المباشرة بالذكاء الاصطناعي غير مكتملة تماماً: مثلاً، بالتأكيد أتمنى لو أن باستطاعتي إعادة ترتيب الملاحظات التي أدوِّنها. ورغم ذلك، فهي مُدرَجة في القائمة القصيرة لأدوات الذكاء الاصطناعي التي تركت تأثيراً حقيقياً على إنتاجيتي.

من ناحية أخرى، أشعر بالمتعة أكثر من شعوري بتلقي مساعدة، عندما أعتمد على ميزة «أوديو أوفير فيو» (Audio Overview) الجديدة بتطبيق «نوتبوك إل إم»، التي تنتشر على نطاق واسع بالوقت الحالي. امنح هذه الميزة بعض الوقت، وسرعان ما ستجدها تبتكر محاكاة «بودكاست»، من بطولة اثنين من المضيفين الآليين يناقشان أي موضوع تتولى تحميله على التطبيق. وفي الواقع، تبدو درجة ثرثرتهما على المستوى البشري مذهلة، رغم أن جوهر الدردشة ربما يميل للسطحية، وقد يبدو حماسهما المصطنع تجاه أي شيء يتحدثان عنه مضحكاً. (على سبيل التجربة، أنشأت «بودكاست» ناقشا خلاله شعور المرء في أثناء مشاهدته طلاء يجف. واتضح لي أن الأمر رائع!).

إنجاز تكنولوجي متميز

وبصورة عامة، أرى أن «أوديو أوفير فيو» إنجاز تكنولوجي مذهل ومثير للاهتمام. وقد نجح بإغرائي لدرجة أنني قضيت نصف يوم في ضخ مواد بداخله فقط لمعاينة ما ستتمخض عنه في النهاية. ومع ذلك، يبدو البرنامج غير مناسب داخل تطبيق مخصص للبحث الجاد. في الواقع، بدا الأمر لي أقرب إلى ندوة جادة حول علم المكتبات، استعان القائمون عليها بساحر لاستعراض مهاراته في خفة اليد المرتبطة بالكتب؛ الأمر الذي ربما يكون نذيراً ينبه إلى أن «نوتبوك» بدأ يفقد بوصلة مساره.

تحديات نضوج التطبيقات الذكية

أما المخاطرة الأكبر المرتبطة بكل من «نوتبوك إل إم» و«تشات جي بي تي 4 أو» المزود بـ«كانفاس»؛ فهي أن أياً منهما لن يبلغ مرحلة النضج، ثم يبقى بالجوار.

الحقيقة أن «غوغل» (التي تصف «نوتبوك إل إم» بأنه «تجريبي») لها تاريخ أسطوري في التخلي عن منتجاتها - حتى عن البعض الرائع المحبوب منها. أما «أوبن إيه آي»، التي تقول إن «كانفاس» بمرحلة تجريبية، فمشغولة للغاية بمهام كبرى على نطاق شديد الاتساع، على نحو يجعل من المستحيل معرفة أين سينتهي المطاف بـ«كانفاس» في خضم أولوياتها الكثيرة.

تطبيقات الكتابة المعتادة

كل هذا يجعلني أشعر بامتنان أكبر تجاه تطبيقين أثبتا جدارتهما بمرور الوقت، وأجدهما لا غنى عنهما، بعد أن قررتُ التوقف عن استخدام «أفيرنوت» (Evernote)، العام الماضي، أتولى الآن تدوين ملاحظاتي باستخدام تطبيق لطيف يعمل على أجهزة «ماك» و«آيباد» و«آيفون»، يعرف باسم «بير» (Bear).

وفيما يتعلق بمشروعات الكتابة، التي تتضمن مواد بحثية وتتجاوز بضعة مئات من الكلمات، استخدم نسخة من «سكريفينر» (Scrivener) تناسب «آيباد» - وهو تطبيق يتمتع بشعبية أسطورية في صفوف كتاب الأنماط الطويلة من الكتابة.

وإضافة لكونهما ممتازين، ثمة عنصر مشترك آخر بين «بير» و«سكريفينر»: أنهما منتجان رائدان لشركتين صغيرتين للغاية. وكلاهما مدروس ومركَّز ومكتمل الميزات على نحو غالباً ما يتحقق عندما تكون أنظار الشركة المطورة مركزة على بضعة منتجات، وتسعى الشركة لأن تكون هذه المنتجات جديرة بالمال الذي يجري دفعه مقابلها.

يُذكر أنه لا يوجد لدى أي من «بير» و«سكريفينر» استخدامات واضحة مرتبطة بالذكاء الاصطناعي. ولست واثقاً مما إذا كان ذلك يعكس قراراً مدروساً من جانب مبتكريهما، أو مجرد نتيجة لنقص في الموارد. إلا أن هذا الأمر يزعجني، فقط لأنه قد يأتي اليوم الذي تجد الشركات المطورة الصغيرة نفسها عاجزة عن المنافسة بمجال الذكاء الاصطناعي على نحو يهدد بقاءها، في مواجهة «أوبن إيه آي» و«غوغل».

ومع هذا ينبغي الانتباه هنا إلى أن «بير» و«سكريفينر» تحديداً على وشك نيل بعض وظائف الذكاء الاصطناعي، دون أدنى مجهود من جانبهما، وذلك لأن ميزات الذكاء الاصطناعي الجديدة من «آبل»، المقرر طرحها، تتضمن العديد من أدوات الكتابة، التي ستتاح عبر أنظمة «آي أو إس»، و«آيباد»، و«ماك»، بما في ذلك خيارات لإعادة الكتابة ومراجعة النصوص وتلخيصها وتنسيقها. وفي حين أنها لا تحاكي الجوانب الأكثر طموحاً من «كانفاس» و«نوتبوك إل إم»، فإنها ستوفر لكل تطبيق يتضمن مدخلات نصية مستوى أساسياً من قدرات الذكاء الاصطناعي.

وآمل أن يتجاوز «تشات جي بي تي» مع «كانفاس» و«نوتبوك إل إم» وضعهما الراهن باعتبارهما نماذج أولية.

وأرى أنه مثلما الحال مع كثير من منتجات الذكاء الاصطناعي التوليدي، يتميز الاثنان بالفعل بأداء مذهل، لكن هذا لا يكفي لضمان استمرارهما.

* مجلة «فاست كومباني» - خدمات «تريبيون ميديا»



تقنية جديدة تمنح الروبوتات ذاكرة للمكان والزمان

النظام يمنح الروبوتات ذاكرة طويلة الأمد تربط الأشياء بالأماكن والأوقات التي ظهرت فيها (الجامعة)
النظام يمنح الروبوتات ذاكرة طويلة الأمد تربط الأشياء بالأماكن والأوقات التي ظهرت فيها (الجامعة)
TT

تقنية جديدة تمنح الروبوتات ذاكرة للمكان والزمان

النظام يمنح الروبوتات ذاكرة طويلة الأمد تربط الأشياء بالأماكن والأوقات التي ظهرت فيها (الجامعة)
النظام يمنح الروبوتات ذاكرة طويلة الأمد تربط الأشياء بالأماكن والأوقات التي ظهرت فيها (الجامعة)

طوّر باحثون في معهد ماساتشوستس للتكنولوجيا إطاراً جديداً للذاكرة طويلة الأمد، يهدف إلى تمكين الروبوتات من تذكّر الأماكن والأشياء والأحداث التي رصدتها في أثناء تحركها في البيئات الحقيقية.

وقد يتيح هذا التوجه مستقبلاً للروبوت الإجابة عن أسئلة بسيطة مثل: أين تركت محفظتي؟ أو أين وُضع الجزء الذي كنا نعمل عليه بالأمس؟ لكن النظام لا يزال مشروعاً بحثياً، ولم يتحول بعد إلى أداة منزلية جاهزة للبحث عن الأشياء المفقودة.

يحمل النظام اسم «دام» ( DAAAM) وهو اختصار لعبارة تعني «وصف أي شيء، في أي مكان، وفي أي وقت». ويجمع بين الخرائط الثلاثية الأبعاد والرؤية الحاسوبية والنماذج اللغوية، لبناء ذاكرة مكانية وزمنية يستطيع الروبوت البحث فيها باستخدام اللغة الطبيعية.

ذاكرة مرتبطة بالعالم الحقيقي

تستطيع روبوتات كثيرة اليوم رسم خريطة للمكان وتحديد موقعها داخله، لكن هذه الخرائط تركز غالباً على الأبعاد الهندسية والعوائق والمسارات، ولا تحتفظ بالضرورة بوصف غني للأشياء الموجودة في كل موقع.

أما نماذج الرؤية متعددة الوسائط، فيمكنها التعرف على محتوى الصور ووصف الأجسام والمشاهد، لكنها قد لا تكون مصممة لتخزين هذه المعلومات داخل خريطة واسعة ومتغيرة عبر الزمن.

يحاول «DAAAM» الجمع بين القدرتين، على سبيل المثال، عند تحركه داخل منزل أو مصنع أو حرم جامعي، يسجل الأشياء التي يراها ويربط أوصافها بمواقعها على خريطة ثلاثية الأبعاد.

فقد يتذكر أن دراجة حمراء ذات إطار مثقوب كانت موجودة في موقف خارج مبنى معين، أو أن قطعة صناعية تُركت في صندوق تخزين في منطقة محددة خلال اليوم السابق. ويسمح هذا الربط للروبوت بفهم السؤال من حيث المكان والزمن والصفات، بدلاً من البحث عن اسم الشيء وحده.

اختيار الصور الأكثر فائدة

تتمثل إحدى العقبات أمام بناء هذا النوع من الذاكرة في كمية المعلومات التي يلتقطها الروبوت. فقد تمر أمام كاميراته مئات الأشياء خلال دقائق، بينما يستغرق وصف كل جسم على حدة وقتاً وقدرة حاسوبية كبيرين. لمعالجة ذلك، يجمع النظام الأشياء المتقاربة في مجموعات، ثم يختار لقطات رئيسية توفر أوضح رؤية لأكبر عدد منها. وبعد ذلك، يمكنه وصف عدة أشياء بالتوازي بدلاً من تحليل كل جسم بصورة منفصلة.

ويقول الباحثون إن هذه الطريقة تسرّع عملية إنشاء الأوصاف بنحو عشرة أضعاف، ما يسمح للنظام بالعمل في الوقت الحقيقي داخل بيئات واسعة. كما يحاول الإطار تجنب تكرار معالجة الجسم نفسه؛ إذ يسجل وصفه مرة واحدة ثم يربطه بموقعه داخل الخريطة.

تساعد التقنية الروبوتات على استرجاع مواقع الأدوات والأغراض داخل المنازل والمصانع على أن تكون قد رصدتها مسبقاً (الجامعة)

البحث باللغة الطبيعية

بعد بناء الذاكرة، يظل التحدي في الوصول بسرعة إلى المعلومة المناسبة وسط قاعدة بيانات كبيرة من المواقع والأجسام والأوصاف. ولهذا يستخدم النظام نموذجاً لغوياً يمكنه اختيار أدوات بحث مختلفة بحسب السؤال؛ فإذا سأل المستخدم عن منحوتة رآها الروبوت، يستطيع النظام البحث دلالياً عن كلمة «منحوتة». أما إذا تضمن السؤال موقع مبنى معين، فيمكنه استخدام أداة بحث مكانية. وتسمح هذه الآلية للنظام بتقسيم السؤال إلى عناصر محددة، بدلاً من الاعتماد على النموذج اللغوي وحده لتخمين الإجابة. ويرى الباحثون أن ذلك يساعد على تقليل الهلوسة؛ لأن الإجابة تستند إلى سجلات فعلية جمعها الروبوت من البيئة. وفي الاختبارات، تفوّق «DAAAM» على طرق منافسة بنسب تراوحت بين 21 و53 في المائة، بحسب نوع السؤال المستخدم في التقييم.

من المصانع إلى الواقع المعزز

قد تكون المصانع من أوائل البيئات المستفيدة من ذاكرة مكانية طويلة الأمد، حيث يمكن للعامل أن يطلب من روبوت العثور على أداة أو مكوّن تُرك في وردية سابقة، بدلاً من توجيهه يدوياً إلى الموقع. كما يمكن استخدام الفكرة في أنظمة الواقع المعزز المخصصة لفنيي الصيانة، بحيث تساعدهم على تذكّر مواضع المعدات أو رصد التغيرات غير المعتادة. وقد تفيد أيضاً في الملاحة داخل المباني والأماكن المعقدة.

لكن قدرة النظام الحالية تتركز على الأشياء والمواقع التي رصدها الروبوت بالفعل. فهو لا يعرف مكان المفاتيح إلا إذا كانت كاميراته قد شاهدتها، وربطت وصفها بموقع واضح، واحتفظت بهذه المعلومة داخل الذاكرة.

الخطوات التالية

يعمل الباحثون الآن على توسيع الإطار حتى يتمكن من تسجيل الأحداث المهمة، وليس فقط أوصاف الأجسام والمواقع. كما يخططون لإضافة مستويات ثقة إلى الإجابات، كي يوضح الروبوت مدى يقينه من المعلومة التي يقدمها. والهدف الأبعد هو تطوير روبوتات عامة تستطيع تنفيذ أنواع مختلفة من المهام بناءً على أوامر لغوية بسيطة. ويتطلب ذلك ألا ترى البيئة فقط، بل إن تتذكر كيف تغيرت بمرور الوقت، وأن تسترجع التفاصيل المناسبة عند الحاجة. بهذا المعنى، لا يقدم البحث روبوتاً منزلياً يعثر فوراً على المفاتيح المفقودة، لكنه يضع أساساً لذاكرة تجعل الآلات أكثر قدرة على فهم العالم بالطريقة التي يستخدم بها البشر المكان والزمن واللغة.


تعلّمْ كيفية التعلٌّم باستخدام الذكاء الاصطناعي

تعلّمْ كيفية التعلٌّم باستخدام الذكاء الاصطناعي
TT

تعلّمْ كيفية التعلٌّم باستخدام الذكاء الاصطناعي

تعلّمْ كيفية التعلٌّم باستخدام الذكاء الاصطناعي

لطالما تطوّرت التكنولوجيا، لكن هذا «التطوّر» يحدث عادةً بوتيرة بطيئة ومدروسة. إلا أنّ مشاهدة كيفية تطوّر الذكاء الاصطناعي وتحسينه وتوسّعه حالياً تُشبه مشاهدة أحد مقاطع الفيديو بتقنية التصوير الزمني السريع لناطحة سحاب قيد الإنشاء -أو مياه الفيضان وهي ترتفع- هذا ما يجعلك تشعر بالإلهام أو بالإحباط. هناك شعور بأنّه لا يُمكن وقفه، كما كتب غاي سوليفان(*).

رغبة في التعلم والتعليم

والأمل أن يتمكّن الناس من تحويل ذلك إلى تحدٍّ للانخراط في الذكاء الاصطناعي وتبنّيه، وفي نهاية المطاف الاستفادة منه إلى أقصى حد. وسيتطلّب هذا الموقف رغبةً في التعلّم. كما سيتطلّب، بالنسبة إلى كثيرين، رغبةً في التعليم -لتعليم أدوات الذكاء الاصطناعي مع ازدياد تعقيدها، وتعليم الزملاء في أثناء اكتشافهم كيفية استخدام الذكاء الاصطناعي في سير عملهم اليومي.

من التدريب التقليدي إلى التعلم الشخصي المدعوم بالذكاء الاصطناعي

تقيس معظم المؤسسات نمو الموظف وجاهزيته للترقية من خلال مقارنته بـ«نموذج الكفاءة». ولكن كيف يمكن قياس تطور الموظف في ظل تغير المعايير بهذه السرعة في عصر الذكاء الاصطناعي؟

وفقاً لبريت لوكاسيو، المدير الإداري في شركة «كيه بي إم جي (KPMG LLP)» الأميركية المتخصصة في التدقيق والضرائب والاستشارات، فإن الأمر يتعلق بتغيير ثقافة التعلم. يقول: «نحن نطور تصاميم تركز على الأفراد وتعمل في كلا الاتجاهين... إذ نستخدم الذكاء الاصطناعي لإطلاق العنان لقوة التعلم، ونستخدم التعلم لإطلاق العنان لقوة الذكاء الاصطناعي».

كيف تطبق الشركات الذكاء الاصطناعي لتحويل التعلم عملياً؟

يعيد لوكاسيو وفريقه النظر في كيفية تطبيق الذكاء الاصطناعي في مختلف جوانب عملهم، متجاوزين الأساليب التقليدية لتحقيق قيمة كبرى من الأدوات المتاحة لهم، لا سيما من خلال علاقات «كيه بي إم جي» الاستراتيجية مع شركاء التحالف مثل «غوغل»، و«أنثروبيك»، و«مايكروسوفت».

يستخدم لوكاسيو وفريقه أدوات الذكاء الاصطناعي لإنشاء تجارب تدريبية جديدة ومبتكرة بوتيرة أسرع من أي وقت مضى. أشار لوكاسيو إلى أن «عديداً من الناس يتعلمون بطرق مختلفة ولديهم مجموعة مهارات مميزة لإتقانها». وأضاف: «يُمكّننا الذكاء الاصطناعي من استهداف تجارب التعلم وتخصيصها بشكل أفضل بما يتناسب مع كل فرد، مما يُعزز أثرها على نمو المشاركين».

جعل التعلم أسرع وأكثر إنسانية

سمح الترويج المبكر لأدوات الذكاء الاصطناعي واعتمادها شركة «كيه بي إم جي» برؤية نتائج سريعة، لا سيما فيما يتعلق بتصميم وتطوير برامج التعلم. وأوضح لوكاسيو: «انخفض الوقت اللازم لإعداد المسودة الأولى لبرنامج تدريبي بنسبة 75 في المائة في كثير من الحالات». وأضاف: «هذا يُمكّن الموظفين من التركيز على القيمة المضافة في العملية التي لا تتحقق إلا من خلال الخبرة واللمسة الإنسانية». وأضاف أن «هذا الجانب يتعلق بتعزيز أداء موظفينا ليكونوا أكثر ابتكاراً واستراتيجية وتأثيراً».

ويُعدّ دمج مكونات الذكاء الاصطناعي في تجارب التعلم أمراً أساسياً، وليس اختيارياً. ويُمكّن الذكاء الاصطناعي متخصصي التدريب والتطوير من إثراء تجارب التعلم التقليدية الرسمية بنماذج تعلم تفاعلية تتطلب مشاركة كبرى.

ودعت الشركة إلى تبادل الخبرات بشكل غير رسمي حول ما وجدوه مفيداً وكيف تعلموا استخدام الذكاء الاصطناعي في مختلف جوانب عملهم. ولتحقيق أقصى استفادة من هذا النهج، شجعت على المشاركة على جميع المستويات الوظيفية لأن إشراك مشاركين ذوي مستويات خبرة متفاوتة وانفتاح على الابتكار يُعزز أفضل النتائج.

كفاءة ذكاء اصطناعي مدعومة بالحكمة البشرية

بدأت فرق التعلم والتطوير في «كيه بي إم جي» وعديد من الشركات الأخرى التي تحدثت معها، في الارتقاء بالذكاء الاصطناعي إلى مستوى جديد، وذلك من خلال تبنيه أداةً لمساعدة المحترفين على التفكير بشكل مختلف. ذلك أن الذكاء الاصطناعي لن يحل محل الحكمة البشرية الحقيقية، ولكنه يُمكن أن يُوفر وقتاً للتركيز على جوانب العمل التي تتطلب هذه الحكمة. وهذا هو الرأي نفسه السائد أكثر في عدد من مؤسسات القطاعات القانونية والمالية وحتى التقنية.

* خدمات «تريبيون ميديا».


أداة جديدة في «رسائل غوغل» لكشف الصور المنشأة بالذكاء الاصطناعي

يختبر تطبيق «رسائل غوغل» أداة تكشف ما إذا كانت الصور أُنشئت أو عُدلت باستخدام الذكاء الاصطناعي
يختبر تطبيق «رسائل غوغل» أداة تكشف ما إذا كانت الصور أُنشئت أو عُدلت باستخدام الذكاء الاصطناعي
TT

أداة جديدة في «رسائل غوغل» لكشف الصور المنشأة بالذكاء الاصطناعي

يختبر تطبيق «رسائل غوغل» أداة تكشف ما إذا كانت الصور أُنشئت أو عُدلت باستخدام الذكاء الاصطناعي
يختبر تطبيق «رسائل غوغل» أداة تكشف ما إذا كانت الصور أُنشئت أو عُدلت باستخدام الذكاء الاصطناعي

تعمل «غوغل» على تطوير أداة داخل تطبيق «رسائل غوغل» قد تساعد المستخدمين على معرفة ما إذا كانت الصور المتداولة في المحادثات قد أُنشئت أو عُدلت باستخدام الذكاء الاصطناعي. ولا يبدو أن الميزة ستكتفي بإصدار حكم مبسط بأن الصورة «حقيقية» أو «مولّدة»، بل قد تعرض معلومات أكثر تفصيلاً عن طريقة إنشائها والتعديلات التي أُجريت عليها، حسب موقع «آندرويد أوثوروتي».

ظهرت مؤشرات الميزة الجديدة خلال تحليل نسخة تجريبية من التطبيق على نظام «أندرويد»، لكن الأداة ليست متاحة للمستخدمين حتى الآن. كما لم تؤكد «غوغل» موعد إطلاقها. وقد تتغيّر خصائصها أو لا تصل إلى النسخة العامة، نظراً إلى أن المعلومات المتاحة تستند إلى شيفرة وعبارات موجودة في إصدار لا يزال قيد التطوير.

تفاصيل تتجاوز التصنيف البسيط

تشير العبارات المكتشفة داخل التطبيق إلى أن «رسائل غوغل» قد يميز بين صور أُنشئت بالكامل بالذكاء الاصطناعي، وأخرى التُقطت بالكاميرا ثم عُدلت بأدوات ذكية.

ومن بين الأوصاف التي يجري إعدادها داخل التطبيق «وسائط أُنشئت باستخدام الذكاء الاصطناعي»، و«عُدلت باستخدام أدوات ذكاء اصطناعي متعددة»، و«أجزاء من هذه الوسائط أُنشئت بالذكاء الاصطناعي». كما تظهر أوصاف أخرى لصور التُقطت بالكاميرا من دون تعديلات برمجية، أو جُمعت من عدة صور، أو عُدّلت بأدوات غير قائمة على الذكاء الاصطناعي.

هذا التفصيل مهم، لأن استخدام التقنية في الصور لا يأخذ شكلاً واحداً. فقد تكون الصورة مولدة بالكامل، أو قد تكون صورة حقيقية خضعت لتغيير محدود، مثل إزالة عنصر أو استبدال الخلفية. وفي حالات أخرى، قد يجري دمج صور حقيقية مع أجزاء اصطناعية، ما يجعل التصنيف الثنائي بين «حقيقي» و«مزيف» غير كافٍ.

يتوقع أن تظهر معلومات المنشأ والتعديل عند فتح الصورة واختيار عرض التفاصيل داخل المحادثة (رويترز)

الوصول إلى المعلومات من المحادثة

وفقاً للمؤشرات الموجودة في النسخة التجريبية، قد يصل المستخدم إلى هذه المعلومات عبر فتح صورة داخل المحادثة، ثم اختيار «عرض التفاصيل» من القائمة. وقد تظهر عندها بيانات مرتبطة بمصدر الصورة والجهة أو الأداة التي أنشأتها أو عدلتها.

ولا توجد حتى الآن إشارة مؤكدة إلى ظهور ملصق تحذيري تلقائي فوق كل صورة داخل المحادثة. فقد تتطلّب الميزة من المستخدم فتح التفاصيل والتحقق بنفسه، بدلاً من عرض النتيجة مباشرة في واجهة الدردشة.

ورغم أن ذلك يضيف بعض الخطوات، فإنه قد يجعل فحص مصدر الصور أسهل من نقلها إلى تطبيق آخر أو استخدام خدمة منفصلة للتحقق منها.

الاعتماد على بيانات مصدر المحتوى

يبدو أن الأداة تعتمد على معيار «بيانات اعتماد المحتوى» التابع لتحالف «C2PA»، وهو معيار مفتوح يسجل معلومات عن منشأ الوسائط الرقمية والتغييرات التي مرت بها.

تعمل هذه البيانات بطريقة تشبه السجل الرقمي المرفق بالصورة. ويمكن أن توضح ما إذا كانت الوسائط خرجت مباشرة من كاميرا داعمة للمعيار، أو خضعت لتعديلات لاحقة، أو مرت عبر أدوات للذكاء الاصطناعي.

ولا يقوم النظام بالضرورة بتحليل شكل الصورة بحثاً عن علامات التزييف، كما تفعل بعض أدوات الكشف التقليدية. بدلاً من ذلك، يقرأ بيانات موثقة مرتبطة بتاريخ الملف وطريقة إنشائه. ويعني ذلك أن فاعليته تعتمد على وجود بيانات اعتماد متوافقة داخل الصورة وعلى عدم فقدانها أو إزالتها خلال عمليات الحفظ والنقل.

لا تزال الميزة قيد التطوير كما أن غياب بيانات الاعتماد لا يعني تلقائياً أن الصورة مزيفة أو غير موثوقة (أ.ف.ب)

توجه أوسع لدى «غوغل»

لا تأتي التجربة في «رسائل غوغل» بمعزل عن تحركات أخرى للشركة. فقد وسّعت «غوغل» أدوات التحقق من المحتوى داخل تطبيق «جيميناي». كما أعلنت دعم التحقق من بيانات «C2PA» في خدمات أخرى، بهدف إظهار ما إذا كان المحتوى أصلياً من الكاميرا أو خضع لتعديلات، والأدوات التي استُخدمت في ذلك.

وتستخدم الشركة أيضاً تقنية «SynthID»، التي تطورها «غوغل ديب مايند»، لإضافة علامات مائية رقمية غير مرئية إلى المحتوى المنشأ أو المعدل بأدواتها للذكاء الاصطناعي. ويمكن لأنظمة متوافقة فحص هذه العلامات للمساعدة على تحديد مصدر المحتوى.

لكن «C2PA» و«SynthID» لا يعملان بالطريقة نفسها. فالأول هو معيار لتوثيق تاريخ المحتوى ومصدره عبر بيانات اعتماد رقمية، في حين يعتمد الثاني على علامة مائية مضمنة داخل الصورة أو الوسائط التي تنتجها أدوات «غوغل».

الحاجة إلى الحذر

قد تساعد الميزة المستخدم على فهم الصور التي تصل إليه عبر الرسائل، لكنها لن تكون ضماناً مطلقاً لصحة كل صورة. فالملف الذي لا يحتوي على بيانات اعتماد لا يعني تلقائياً أنه مزيف. كما أن غياب علامة مرتبطة بالذكاء الاصطناعي لا يثبت أن الصورة لم تخضع لأي تعديل.

وقد تُفقد بعض البيانات عند ضغط الصور، أو التقاط لقطة شاشة منها، أو تمريرها عبر تطبيقات لا تحتفظ بالمعلومات المرفقة. لذلك، تقدم هذه الأدوات سياقاً إضافياً حول مصدر المحتوى، لكنها لا تلغي الحاجة إلى التحقق من السياق والمرسل والمصدر الأصلي.

إذا وصلت الميزة إلى الإصدار العام، فستجعل «رسائل غوغل» جزءاً من توجه أوسع لنقل أدوات التحقق من الصور إلى الخدمات التي يستخدمها الناس يومياً. فبدلاً من انتظار المستخدم ليشك في صورة ويبحث عن أداة مستقلة، قد تصبح معلومات المصدر متاحة من داخل المحادثة نفسها.

Your Premium trial has endedYour Premium trial has ended