الخميس، 26 سبتمبر 2019

كل ما تريد معرفته عن تحديث خوارزمية بحث جوجل للتقارير الإخبارية الأصلية 

كل ما تريد معرفته عن تحديث خوارزمية بحث جوجل للتقارير الإخبارية الأصلية 

البوابة العربية للأخبار التقنية البوابة العربية للأخبار التقنية

كل ما تريد معرفته عن تحديث خوارزمية بحث جوجل للتقارير الإخبارية الأصلية

أعلنت جوجل في وقت سابق من هذا الشهر عن تحديث لخوارزمية البحث الخاصة بها، وذلك بهدف تسليط الضوء على (التقارير الإخبارية الأصلية) Original Reporting؛ لتظل لوقت أطول في أعلى نتائج البحث، وتسعى جوجل من خلال هذا التحديث إلى إظهار التغطية الإخبارية من المصادر الأصلية بصورة أبرز من التغطية الموجودة في المنشورات التي تقتبس من المصادر الأصلية.

هذا التحديث مخصص لمساعدة كل من الناشرين والباحثين؛ حيث سيسهل على الناس الوصول إلى التقارير الأصلية الأكثر موثوقية مباشرةً من المصدر، كما سيستفيد الناشرين من ظهور تقاريرهم الأصلية لفترة أطول في نتائج البحث، ومشاهدتها على نطاق أوسع.

عقب هذا الإعلان أجرت (شبكة المحررين العالمية) Global Editors Network – التي يُشار إليها اختصارًا (GEN) – حوارًا مع (ريتشارد جينجراس) Richard Gingras؛ نائب الرئيس لأخبار جوجل، لفهم كيف ستعمل تحديثات الخوارزمية، وما هي أبرز تأثيراتها؟

والأهم من ذلك، معرفة كيف تقوم جوجل بتصنيف وسائل الإعلام، وتقييمها؟ هل يمكن لمعايير جوجل الخاصة بالمصادر الموثوق بها (Reputable Sources) أن تعطي الأفضلية لوكالات الأخبار الكبيرة، وبالتالي تزيد من عدم المساواة بين الناشرين؟

إليك أهم ما جاء في الحوار مع (ريتشارد جينجراس):

السؤال الأول: طالبت المؤسسات الإخبارية بوجود شفافية أفضل في تصنيفات بحث جوجل منذ وقت طويل، لماذا استغرق الأمر كل هذا الوقت لتغيير خوارزمية البحث وتحديد أولويات التقارير الأصلية؟ لماذا قررتم إجراء هذا التغيير الآن؟

ريتشارد جينجراس: إن فهم التقارير الأصلية والتعرف عليها يمثل دومًا أولوية قصوى في جوجل، كما أن ما تغير خلال عشر سنوات من العمل على الأخبار في جوجل هو أننا أصبحنا الآن أكثر تطوراً تقنياً مما كنا عليه في ذلك الوقت، فنحن نتعلم، ونتناقش مع الصحفيين، ونطور نماذج جديدة تحتاج إلى التجربة والاختبار أولًا، لذلك دائمًا ما يكون بحث جوجل قيد التطوير.

الخطوة الأولى في معالجة التقارير الأصلية هي فهم التغييرات في مجموعة متطورة من القصص وفهم طبيعة العوامل التي تعتمد عليها من تغطية إضافية قائمة على الحقائق، مرورًا بالتحليل والتعليق.. إلخ. ما هي “الإشارات” التي تشير إلى تقرير أصلي؟ أو ما هي مكونات التقارير الأصلية؟ هل لديها بعض أو العديد من الاقتباسات؟ هل الاقتباسات فريدة أو زائدة عن الحاجة؟ هل هناك مزيد من المعلومات الواقعية، أو التحليل ذي الصلة؟ هل هناك نسب إلى أطراف أخرى؟

في الواقع؛ تعتبر القدرة على وصف ماهية التقارير الأصلية أمر ًاصعبًا، وهذا يعني أشياء مختلفة للمحررين ووكالات الأخبار في أوقات مختلفة، ولكن كيف تترجم ذلك إلى خوارزمية؟ هدفنا هو توفير أفضل النتائج، وأكثرها فائدة لعملائنا، هذه الأهداف قد تكون قريبة من بعضها ولكنها ليست متداخلة.

السؤال الثاني: يجب التعرف على التقارير الأصلية لضمان أن تبقى في أعلى نتائج البحث لفترة أطول، كيف يمكن أن تضمن خوارزميات جوجل هذا في ضوء التدفق غير المحدود للتقارير الجديدة؟

في الحالات التي يتم فيها تحديد جزء أساسي من التقارير الأصلية، نحتاج بعد ذلك إلى تحديد أفضل طريقة لتصنيفها وتقديمها، ويعتمد السياق على كيفية وصول الناس إلى المعلومات.

يختلف الأمر اختلافًا كبيرًا في بيئات الخلاصة المخصصة  – مثل: أخبار جوجل، واكتشف Discover، إلخ – مقابل البحث في وقت محدد، بالإضافة إلى الإشعارات التي تكون مختلفة تمامًا، فعلى سبيل المثال، في طريقة البحث في أهم الأخبار فإن الطريقة التي نضمن بها إمكانية الرؤية والاكتشاف لحالات محددة من التقارير الأصلية تتمثل في مواجهة عامل تحديث (freshness factor) هذه النتائج، وزيادة ظهورهم في أعلى نتائج البحث. بمعنى أن الوقت المحدد لبقاء التقرير الأصلي في أعلى نتائج البحث يختلف باختلاف وقت وتطور القصة.

كما هو الحال دائمًا سنقوم بتجربة وتقييم الأساليب المختلفة. لكن يرجى ملاحظة أنه على الرغم من أن إعلاننا الأخير يمثل خطوة أخرى إلى الأمام، إلا أننا لم نعلن عن إنجاز المهمة حتى الآن، وذلك نظرًا للتطوير المستمر، حيث نحتاج دائمًا إلى تحسين وتطوير أنظمتنا بمرور الوقت كما فعلنا منذ الأيام الأولى من بحث جوجل.

السؤال الثالث: في منشور الإعلان عن تحديث خوارزمية البحث؛ أشرتم إلى أنه لا يوجد تعريف مطلق للتقارير الأصلية، ولا يوجد معيار مطلق لإثبات مدى صحة مقال ما، بناءً على ذلك كيف ستتعامل الخوارزمية الجديدة مع هذا الغموض وما هي معايير جوجل للتقارير الأصلية؟

كما نفعل دائمًا؛ سوف نستكشف ما نعتقد أنه قد يكون إشارات مفيدة، ونختبرها، ونقيم النتائج. لقد أجرينا العديد من المناقشات مع المحررين والصحفيين للاستفادة من مساهماتهم وسوف نستمر في ذلك. نحن حريصون جدًا على مشاركة المعلومات حول إشارات محددة لمنع التلاعب، وسنواصل تحسين النظام، وإلى جانب تحليلنا الخاص؛ سيتم الحكم على فعالية جهودنا من قبل الآخرين.

السؤال الرابع: من أهم القواعد الإرشادية لمن يقومون بالتقييم هي التعرف على مصدر معايير موثوق مثل: الجوائز الصحفية ولا سيما جوائز بوليتزر؛ هل تعتقد أن خوارزمية جوجل الجديدة قد تفضل عن غير قصد وكالات الأخبار الكبيرة، وبالتالي تفاقم عدم المساواة بين الناشرين؟ وكيف يمكن تخفيف هذا الخطر؟

جوائز الصحافة هي معيار بالفعل؛ ولكنها معيار واحد فقط من بين العديد المعايير المهمة، لقد كانت جزءًا من إرشادات التصنيف الخاصة بنا لفترة طويلة ويجب ألا تُفسر على أنها إشارة نهائية إلى أنظمتنا. تضيف التحديثات الأخيرة للقواعد الإرشادية على وجه التحديد التقارير الأصلية باعتبارها سمة أخرى من سمات جودة المصدر بشكل مستقل عن أي جائزة. أيضا فإن من يقومون بالتقييم لا يصنفون التقارير لحظيًا، ولا يقومون بترتيبها، نحن نحاول أن نكون منصفين مع الناشرين الصغار، والقدامى، والمحليين، والعالميين، ونرحب بالتقييم المستمر لعملنا.

للتأكيد على ما أشرت إليه في وقت سابق، هذه ليست مهمة أُنجزت بالفعل، أنظمتنا سوف تتطور مع مرور الوقت. العمل الذي يقوم به الصحفيون والناشرون له أهمية كبيرة ونحن ملتزمون بمساعدة مستخدمينا على الوصول إلى الصحافة الجيدة بطريقة مناسبة، مما يمنحهم فهمًا أعمق لقصة أو قضية، ومساعدتهم على فهم مجتمعاتهم والأحداث الجارية من حولهم.

السؤال الخامس: توظف جوجل نحو 10000 شخص من أطراف ثالثة يُطلق عليهم (مقيمي جودة البحث) search quality raters، وسيقدمون تعليقات على الخوارزمية الجديدة لتحسينها، هل يمكن أن تخبرنا عن عملية الاختيار، وتدريب هؤلاء الأشخاص؟ وكيف يمكنك تقليل التحيز في التصنيف؟

أولاً، دعنا نكون واضحين للغاية بشأن ما تفعله وما لا تفعله جهات التحقق من جودة البحث، لا تؤثر جهات التحقيق بشكل مباشر على الترتيب، بل يكمن عملها في تقديم تقييم بشري عام لأنظمة التصنيف الخاصة بنا، كما يتم الاستفادة من تعليقاتهم في أنظمة التعلم الآلي لدينا.

في مهمة التصنيف؛ تقوم جهات التحقق من جودة البحث بتقييم مدى نجاح النتائج في إظهار ما يبحث عنه شخص ما، وتقييم جودة النتائج بناءً على الخبرة وصلاحية، وموثوقية المحتوى. ولا تُستخدم التصنيفات مباشرة في أنظمة البحث الخاصة بنا لإعطاء صفحات، أو مواقع معينة أي نوع من التصنيف أو النتيجة، وبدلاً من ذلك تساعدنا التصنيفات على فهم مدى تلبية أنظمتنا لعمليات البحث بشكل عام، وكأمثلة للتعلم منها.

أما بالنسبة لمن يقومون بالتقييم، فهؤلاء أشخاص عاديون يعملون عادةً من المنزل، يتم تعيينهم وتوظيفهم بواسطة شركات معينة التي تُعرف باسم (Vendor Companies)، ونحن نتعامل أيضا مع شركات متعددة في الوقت نفسه.

لتوظيفهم؛ يجب أن يجتازوا اختبارًا مُدارًا من قِبل الشركات التي تعاقدنا معها، وذلك للتأكد من أن لديهم فهمًا عميقًا لإرشادات تصنيف الصفحات البالغ عددها 167 صفحة. يقوم البائعون أيضًا بتقييم هؤلاء الأشخاص بانتظام للتأكد من أنهم يحافظون على فهم لإرشاداتنا ويعملون معهم.

السؤال السادس: كيف تلتزم جوجل بالشفافية فيما يخص التصنيف؟ وهل يمكن للمنظمات الإخبارية أن تعرف ماهية تصنيفها وكيف يمكن تحسينه؟

تمارس جوجل الشفافية بثلاث طرق هي؛ الأولى: نقل السياسات والمبادئ التي تواجه عمل الخوارزمية، الثانية: تفسير منهجياتنا العملية بقدر الإمكان ضمن حدود الأمن والحماية من مخاطر التلاعب، والثالثة: نتائجنا كلها متاحة للناس لتقييمها، ونعمل أيضًا مع الباحثين الأكاديميين لدعم تحليلاتهم، كما تطور جوجل أنظمة للقضاء على تحيز أي فرد على نتائج الخوارزمية.

السؤال السابع: إذا كانت جوجل تتحمل مسؤولية تصنيف المؤسسات الإخبارية، فما هو دور المبادرات الأخرى مثل: مشروع الثقة (Trust Project)، ومبادرة الثقة في الصحافة (Journalism Trust Initiative)؟ لماذا لا تقوم جوجل بدمج المنظمات الصحفية في هذه العملية؟

يخدم جمع جوجل للإشارات ونمذجة البيانات توفير نتائج بحث جوجل، وليس كونه وسيلة لإعلام المستخدمين بالخصائص الصحفية للمنشورات.

نحن نستخدم أساليب مختلفة، ومئات الإشارات في القيام بعملنا، كنت مشاركًا رئيسيًا في إنشاء مشروع الثقة وأؤمن بشدة بهدفه المتمثل في زيادة سمات المنظمة وأعمالها الأكثر شفافية. ولكن نتائج جهودهم يمكن أن تكون مفيدة للغاية لمن يوقوموا بالتقييم من خلال زيادة فهم المؤلفين والمنظمات التي تقف وراءهم بشكل أفضل.

السؤال الثامن: هل ينطبق التغيير في الخوارزمية فقط على التقارير باللغة الإنجليزية أو على التقارير بجميع اللغات؟ وهل ستُترجم المقالات التي أبرزتها خوارزمية البحث تلقائيًا؟

سينطبق التغيير الجديد على جميع اللغات؛ بناءً على أدوات التصفح الخاصة بالمستخدم، وقد يتمكن من ترجمة المقالة تلقائيًا. بالإضافة إلى ذلك، يقوم بعض الناشرين بتضمين خيار ترجمة المقالات في مواقع الويب الخاصة بهم لجعل المحتوى في متناول جمهور أوسع خارج نطاق لغتهم الأساسية.

السؤال التاسع: يعمل فيسبوك أيضًا على تطوير نظام تصنيف للمصادر الإخبارية، هل أجريت جوجل مناقشات مع منصات أخرى لتجنب تطوير أنظمة تصنيف مختلفة؟

تدير جوجل محرك بحث على شبكة الإنترنت المفتوحة، نحن لسنا شبكة اجتماعية، وتختلف دوافعنا وطرق تشغيلنا اختلافًا كبيرًا عن شبكات التواصل الاجتماعي، ويجب النظر إلينا وتقييمنا بشكل مختلف أيضًا.

البوابة العربية للأخبار التقنية كل ما تريد معرفته عن تحديث خوارزمية بحث جوجل للتقارير الإخبارية الأصلية 


تعبيراتتعبيرات