تحسين Gemini Nano: تقديم ملخّصات أعلى جودة باستخدام LoRA

تاريخ النشر: 21 أيار (مايو) 2025

يُعدّ التلخيص أحد مهام الذكاء الاصطناعي الأكثر شيوعًا وأهمية باستخدام نماذج لغوية كبيرة (LLM). توفّر الملخّصات وسيلة مهمة لفهم المحتوى الموسّع بسرعة، بدءًا من المقالات الطويلة وسجلّات المحادثات الكثيفة وانتهاءً بالعديد من المراجعات، ما يوفر الوقت ويعزّز الإنتاجية ويسمح باتخاذ قرارات أسرع وبمعلومات أفضل.

هناك العديد من الأنواع المختلفة من الملخصات، مع مستويات مختلفة من التفاصيل و توقعات التنسيق. لتلبية توقعات أنواع الملخصات المختلفة، تعاون فريق Chrome مع Google Cloud لتحسين نتائج Gemini Nano.

لقد حسّنا أداء Gemini Nano باستخدام التوافق منخفض الترتيب (LoRA) لتحسين تجربته وجودة المحتوى الذي يقدّمه، وذلك لجميع أنماط الملخصات وطُولها. بالإضافة إلى ذلك، نفّذنا تقييمات تلقائية وتقييمات آلية لمختلف جوانب جودة الملخص، بما في ذلك دقته وتفصيله وتنسيقه وسهولة قراءته.

لقد وضّحنا هذا الاختلاف بشكل مرئي. يمكنك تجربة هذا التنفيذ والاطّلاع على عرض توضيحي في الوقت الفعلي يقارن بين نتائج Gemini Nano وGemini Nano مع LoRA.

ما هي Summarizer API؟

الشرح الويب الإضافات حالة Chrome النيّة بالشراء
MDN الإصدار 138 من Chrome الإصدار 138 من Chrome العرض Intent to Ship (نية الشحن)

تكثّف واجهة برمجة التطبيقات Summarizer API محتوى ملف ملف شخصي طويلًا إلى ملخّصات موجزة وسهلة الاستيعاب. تم دمج واجهة برمجة التطبيقات في Chrome وتستخدِم Gemini Nano لإجراء الاستنتاج.

قد تتطلّب المواقع الإلكترونية المختلفة استخدام خلاصات تشمل مجموعة من الأنماط والأطوال. على سبيل المثال، إذا كنت تدير موقعًا إلكترونيًا إخباريًا، ننصحك بتقديم قائمة بنقاط مهمة في مقالاتك. بدلاً من ذلك، يمكن للمستخدمين الذين يتصفّحون مراجعات المنتجات الاستفادة من ملخّص سريع وقصير لرأي المستخدمين في المراجعة. للتوضيح، لخّصنا صفحة Wikipedia حول كلاب الويلش كورجي بطول short.

نوع الملخّص النتيجة
headline ## فصيلة كورجي الويلزية: تاريخ الكلاب الملكية وكلاب الرعي
key-points * "الكورجي الويلزي" هو كلب صغير مخصّص لرعي الأغنام، ومنشأه ويلز.
* هناك سلالتان رئيسيتان: بيمبروك وكارديغان ويلش كورجي.
* تُعدّ سلالة "بمبروك" أكثر شيوعًا، وقد ارتبطت بالعائلة الملكية البريطانية.
tldr كلب الراعي الويلزي هو كلب صغير للرعاة له تاريخ طويل في ويلز والعائلة المالكة البريطانية، وينقسم إلى نوعَين: بيمبروك وكارديجان، وكلاهما معروف بوجوهه الشبيهة بالثعلب وأرجله القصيرة وغريزته في الرعي.
teaser تعرَّف على تاريخ كلب الويلش كورجي، بدءًا من أصوله المتواضعة ككلب رعاة للمزارعين الويلشيين ووصولاً إلى رمزيته للعائلة الملكية البريطانية.

يمكنك تجربة صفحات أخرى باستخدام مساحة Summarizer API.

تجربة التحسين

لا يتوفّر خيار التحسين إلا كـ علامة في Chrome Canary، بدءًا من الإصدار 138.0.7180.0. لاستخدام هذا النموذج:

  1. افتح Chrome Canary.
  2. الانتقال إلى chrome://flags/#summarization-api-for-gemini-nano
  3. اختَر مفعّل مع التكيف.
  4. أعِد تشغيل المتصفّح.
  5. افتح وحدة تحكّم أدوات مطوّري البرامج وأدخِل Summarizer.availability(). يؤدي ذلك إلى بدء تنزيل LoRA الإضافية.

بعد اكتمال عملية التنزيل، يمكنك بدء إجراء التجارب.

تقييم أداء أداة التلخيص

لقد قيّمنا تحسين أداء Gemini Nano المحسَّن بشكل أساسي باستخدام طريقتَي تقييم، وهما التقييم التلقائي و التقييم الآلي. يساعد الضبط الدقيق النموذج على تنفيذ مهام معيّنة بشكل أفضل، مثل:

  • ترجمة النصوص الطبية بشكل أفضل
  • إنشاء صور بنمط فني معيّن
  • فهم لغة عامية جديدة

في هذه الحالة، أردنا تلبية توقعات كل نوع ملخّص بشكل أفضل.

التقييم التلقائي

يستخدِم التقييم التلقائي برامج لتقييم جودة النتائج التي يقدّمها النموذج. استخدمنا هذه التقنية للبحث عن أخطاء التنسيق وتكرار الجمل و وجود أحرف غير إنجليزية في ملخصات النصوص المكتوبة باللغة الإنجليزية.

  • أخطاء التنسيق: نتحقّق مما إذا كانت الردود التلخيصية تلتزم بتعليمات التنسيق الخاصة بالطلب. على سبيل المثال، بالنسبة إلى أسلوب النقاط الرئيسية القصيرة، نتحقّق مما إذا كانت كل نقطة قائمة تبدأ بعلامة نجمة (*) وما إذا كان عدد النقاط القائمة لا يتجاوز 3 نقاط.

  • تكرار الجملة: نتحقّق مما إذا كانت الجملة نفسها تتكرّر في ردّ تلخيصي واحد، لأنّ ذلك يشير إلى ردّ منخفض الجودة.

  • الأحرف غير الإنجليزية: نتحقّق مما إذا كان الردّ يتضمّن أحرفًا غير إنجليزية عندما يكون من المفترض أن يكون الإدخال باللغة الإنجليزية.

  • الرابط التشعّبي في الإخراج: نتحقّق ممّا إذا كان الردّ يتضمّن أي روابط تشعبية، بتنسيق Markdown أو نص عادي، غير متوفّرة في الإدخال.

لقد قيّمنا نمطين من الإدخال: المقالات التي تمّ اقتصاصها وسجلّات المحادثات.

  العنوان TLDR النقاط الرئيسية فيديو تشويقي
  الإصدار الأساسي / مع LoRA الإصدار الأساسي / مع LoRA الإصدار الأساسي / مع LoRA الإصدار الأساسي / مع LoRA
أخطاء في التنسيق ‫13.54% / 7.05% ‫41.07% / 4.61% ‫12.58% / 6.36% ‫51.17% / 6.74%
تكرار الجملة 0.07% / 0.07% 0.21% / 0.0% 0.10% / 0.10% 0.10% / 0.03%
الأخطاء غير الإنجليزية 3.95% / 0.03% ‫1.38% / 0.0% ‫2.41% / 0.03% ‫1.44% / 0.0%
الروابط التشعّبية 0.07% / 0.0% 0.14% / 0.0% 0.14% / 0.0% 0.34% / 0.0%
تقييم تلقائي على مستوى 970 مقالة من مختلف أنواع الملخصات
  Headline TLDR النقاط الرئيسية الإعلان التشويقي
  الإصدار الأساسي / مع LoRA الإصدار الأساسي / مع LoRA الإصدار الأساسي / مع LoRA الإصدار الأساسي / مع LoRA
خطأ في التنسيق ‎13.17% / 0.24% ‎22.92% / 0.18% ‫4.43% / 0.09% ‫29.64% / 3.51%
تكرار الجملة 0.0% / 0.0% 0.0% / 0.0% 0.0% / 0.0% 0.03% / 0.0%
خطأ بغير اللغة الإنجليزية 0.15% / 0.0% 0.15% / 0.0% 0.03% / 0.0% 0.06% / 0.0%
الروابط التشعّبية 0.0% / 0.0% 0.0% / 0.0% 0.0% / 0.0% 0.0% / 0.0%
التقييم التلقائي على مستوى 1091 عيّنة من إدخالات المحادثات

بعد تحسين Gemini Nano، شهدنا انخفاضًا كبيرًا في معدّل الأخطاء في التنسيق على مستوى أنواع الملخصات المختلفة، سواء في المقالات أو سجلّات المحادثات.

تقييم أداة التقييم التلقائي

استخدمنا Gemini 1.5 Pro لتقييم التقييم التلقائي، لتقييم جودة المحتوى الذي ينشئه Gemini Nano. وبما أنّ لكل ملخّص غرضًا مختلفًا، كانت المعايير وقيمها مختلفة لأنواع الملخّصات المختلفة. تم تقييم جميع أنواع الملخصات من أجل:

  • التغطية: هل يوضّح الملخص بدقة الغرض الأساسي من المدخل؟
  • الحقائق: هل الملخص صادق؟ هل يقدّم الملخّص معلومات جديدة لم يتم ذكرها صراحةً أو ضمنيًا في النص؟
  • التنسيق: هل تم تنسيق الملخّص باستخدام بنية Markdown صالحة؟ هل يتقيّد الملخّص بحدّ الطول الأقصى للجُمل، كما هو مطلوب؟
  • الوضوح: هل الملخّص متكرّر؟ هل ينقل الملخّص بدقة الرسالة الأساسية باستخدام أقل عدد ممكن من الكلمات؟

بما أنّ أنواع الملخصات هذه لها أغراض مختلفة، تنطبق مقاييس إضافية على أنواع ملخصات معيّنة:

  • التفاعل: (headline): هل يمكن لعامة الناس فهم الملخّص على الفور؟ هل يستخدم الملخّص أسلوبًا جذابًا ومناسبًا للجمهور العام؟
  • الملخّص (tldr): هل الملخّص واضح وموجز وسهل فهمه على الفور لمستخدم يملك فترة تركيز قصيرة جدًا؟ هل يقدّم المحتوى خلاصة فعّالة للرسالة الأساسية في شكل سهل الاستيعاب للقراءة السريعة؟
  • التشويق (teaser): هل يثير الملخّص الفضول ويشجّع القارئ على معرفة المزيد من خلال قراءة النص الكامل؟ هل يستخدم لغة جذابة تشير إلى محتوى مثير للاهتمام؟

قارَنّا بين ناتج النموذج الأساسي والنموذج الذي يتضمّن LoRA جنبًا إلى جنب، باستخدام أداة إعادة الصياغة التلقائية. تم احتساب متوسط تقييمات التقييم الآلي بين 0 و1، ثم تم تقييمه مقارنةً بالحدّ الأدنى.

لضمان الحصول على نتيجة مستندة إلى أسس صلبة، قلّلنا التباين في البيانات والحدّ من الانحياز إلى موضع الإعلان.

  • تقليل التباين في البيانات: لقد احتسبنا متوسط نتائج ثلاثة مخرجات مستقلة لكل إدخال، لأنّ عمليات التنفيذ المستقلة قد تؤدي إلى نتائج مختلفة قليلاً. لقد حسبنا متوسط النتائج لكلّ من النموذج الأساسي وGemini Nano المحسّن. على الرغم من أنّ الاختلافات في النتائج على مستوى النتائج كانت مختلفة قليلاً فقط، فإنّ المتوسطات تساعدنا في فهم مجموعات كبيرة من البيانات بشكل أكثر موثوقية.
  • تخفيف الانحياز حسب الموضع: لتجنّب منح الأولوية لقيمة الملخّص الذي تمت مشاركته أولاً مع المُقيّم، قيّمنا النتائج مرتين، ثم أحطنا النتائج النهائية بالمتوسّط.

    1. لقد قيّمنا النموذج باستخدام LoRA، ثم النموذج الأساسي.
    2. بعد ذلك، تم إلغاء هذا الطلب. لقد قيّمنا النموذج الأساسي، ثم قيّمنا النموذج الذي يتضمّن LoRA.
    3. احتسبنا متوسط النتائج النهائية.
      Short الوسيط طويل
      الإصدار الأساسي / مع LoRA الإصدار الأساسي / مع LoRA الإصدار الأساسي / مع LoRA
    LoRA أولاً ‫74.29% / 86.64% ‫76.11% / 81.38% 68.62% / 78.95%
    النموذج الأساسي أولاً ‫68.02% / 88.60% ‫64.97% / 87.58% ‏58.25% / ‏86.35%
    النسخة ج (متوسطة) ‫71.02% / 89.18% ‫69.59% / 84.08% 63.47% / 82.65%
    نسبة الفوز لنوع الملخّص key-points. وكلما كانت القيم أعلى، كانت النتائج أفضل.

على الرغم من أنّ الفرق في الدرجات للمخرجات من النموذج نفسه كان اختلافًا بسيطًا فقط، تساعدنا المعدّلات في فهم مجموعات كبيرة من البيانات بشكل أكثر موثوقية.

في 500 مقالة، حقّق نموذج Gemini Nano المحسّن أداءً أفضل بكثير مقارنةً بالنموذج الأساسي.

  Headline TLDR النقاط الرئيسية الإعلان التشويقي
  الإصدار الأساسي / مع LoRA الإصدار الأساسي / مع LoRA الإصدار الأساسي / مع LoRA الإصدار الأساسي / مع LoRA
قصير ‫74.74% / 89.12% ‎55.76% / 89.50% ‫71.02% / 89.18% 53.47% / 87.14%
متوسط ‫73.10% / 87.89% ‎41.82% / 81.21% ‫69.59% / 84.08% ‫48.98% / 86.74%
طويل ‫60.99% / 89.32% 50.51% / 84.85% 63.47% / 82.65% ‎62.65% / ‎87.55%
نسبة الفوز في Autorarer على مستوى 500 مقالة من أنواع مختلفة من الملخّصات والطول وكلما كانت الأرقام أعلى، كانت النتائج أفضل.

وقد تبيّن لنا الشيء نفسه عند تقييم 500 سجلّ محادثة، حيث تفوّق Gemini Nano المحسَّن على النموذج الأساسي.

  Headline TLDR النقاط الرئيسية الإعلان التشويقي
  الإصدار الأساسي / مع LoRA الإصدار الأساسي / مع LoRA الإصدار الأساسي / مع LoRA الإصدار الأساسي / مع LoRA
Short ‫70.59% / 96.15% 66.27% / 97.79% ‎81.60% / ‎97.40% 67.48% / 96.14%
الوسيط ‎76.67% / ‎95.13% ‫56.02% / 94.98% ‎82.60% / 97.20% ‫50.41% / 96.95%
طويل 59.03% / 94.32% ‫65.86% / 95.58% ‫75.00% / 97.60% ‫70.94% / 97.16%
نسبة فوز "المقيّم التلقائي" في 500 سجلّ محادثات على مستوى أنواع الملخّصات وأشكال الرسائل المختلفة. وكلما كانت الأرقام أعلى، كانت النتائج أفضل.

توضّح هذه النتائج أنّ عملية التحسين التي أجريناها أدّت إلى تحسين الجودة الإجمالية للملخّص.

ملخّصات أفضل باستخدام LoRA

وعادةً ما يتم إجراء التحسين الدقيق من خلال تعديل مَعلمات النموذج. نماذج الذكاء الاصطناعي الحديثة ضخمة، لذا تكون هذه العملية بطيئة ومكلفة وتتطلّب تخزين نسخة جديدة تمامًا من النموذج.

بدلاً من تغيير جميع المَعلمات، ماذا لو أضفنا أجزاء صغيرة إضافية توجّه النموذج في الاتجاه الذي نريده؟ ويسمح حجمها الأصغر بتدريب أسرع بكثير. وهذا هو المبدأ الأساسي للعملية التكيّف منخفضة الترتيب (LoRA). باستخدام LoRA، تظلّ أجزاء معيّنة من النموذج بدون تغيير، ويُشار إليها غالبًا باسم تجميد المَعلمات. بعد ذلك، يتمّ تقديم مجموعة أصغر من البيانات مع إجراء تصحيحات صغيرة، مع التركيز على جهود التدريب على هذه القطع المُضافة.

في الواقع، يمكنك عادةً تدريب ما يصل إلى% 2 من المَعلمات الأصلية باستخدام LoRA مع مواصلة رؤية تغييرات كبيرة في النتائج.

ما هي أهمية ذلك؟ يمكن دمج العديد من السلوكيات (مثل الأنماط أو المهام أو المعرفة الجديدة) بدون تغيير كل مَعلمة في النموذج. ويمكن التعبير عن هذه التغييرات كأنماط أو اتجاهات صغيرة ضمن المعرفة الحالية للنموذج. ترصد شبكة LoRA هذه الأنماط بكفاءة بدون التأثير في النموذج الأصلي.

اطّلِع على بعض الأمثلة التي تقارن بين النموذج الأساسي لجهاز Gemini Nano والنتائج التي تم الحصول عليها بعد إضافة LoRA.

طلبنا من Gemini Nano إنشاء عنوان قصير "يجذب الانتباه وينقل جوهر المحتوى" في مقالة Wikipedia حول حديقة Joshua Tree الوطنية.

Gemini Nano Gemini Nano مع LoRA
المناظر الطبيعية الفريدة والتاريخ في حديقة Joshua Tree الوطنية Joshua Tree: National Park in California, Straddling Deserts & Home to Iconic Trees

بعد ذلك، طلبنا من Gemini Nano إنشاء إعلان تشويقي قصير لموضوع مقالة Ratatouille. "اكتب جملة واحدة جذابة تشجع المستخدمين على قراءة النص الكامل".

Gemini Nano Gemini Nano مع LoRA
"راتاتوي" هو طبق فرنسي رائج من منطقة بروفانس يتضمّن خضارًا مطهّاة غالبًا ما تشمل الطماطم والثوم. يعود أصل هذه الوصفة إلى القرن الثامن عشر، وتطوّر أسلوب تحضيرها بمرور الوقت، حيث يركز بعض الطهاة على نكهات الخضار الفردية بينما يفضّل البعض الآخر قوامًا ناعماً وأكثر اتساقًا. بالإضافة إلى أصوله الفرنسية، ألهم طبق الراتاتوي أطباقًا مشابهة في مأكولات مختلفة حول العالم، بما في ذلك طبق "البايبيراد" من إسبانيا وطبق "تيان" من منطقة البحر المتوسط. ساهم فيلم "راتاتوي" (2007) في رواج الطبق بشكلٍ أكبر، ما أظهر تنوعه في المطبخ وتأثيره العاطفي. "راتاتوي" هو طبق فرنسي من منطقة بروفانس يتكون من الخضار المطهوة، وهو يملك تاريخًا غنيًا في مجال ẩm الطعام، حيث تطوّر من مجرد حساء بسيط إلى تحفة فنية حديثة في مجال ẩm الطعام أسرت قلوب الجمهور في جميع أنحاء العالم.

الإصدار التجريبي من الاستنتاج في الوقت الفعلي

لقد أنشأنا واجهة توضّح مقارنة النتائج بين Gemini Nano وGemini Nano مع LoRA.

طلبنا من Gemini Nano إنشاء ملخّص tldr بحدّ أقصى short للفقرة المتعلقة بالموضوع سمكة الشمس. تذكَّر أنّ tldr وshort يتطلبان ردًا في جملة واحدة تكون "سهلة القراءة".

يمكنك مشاهدة المدة التي استغرقتها عملية إنشاء النتائج وقراءة الإخراج في الوقت الفعلي.

من خلال تنفيذ التحسينات الدقيقة، يمكن أن ينشئ Gemini Nano ملخّصًا بشكل أفضل يلي التعليمات المحدّدة.

التفاعل مع الملاحظات ومشاركتها

يهمّنا معرفة ملاحظاتك بشأن مدى تأثير ميزة Gemini Nano المحسّنة في الملخصات.

يمكنك الاطّلاع على جميع واجهات برمجة التطبيقات المُدمَجة المستنِدة إلى الذكاء الاصطناعي التي تستخدِم النماذج، بما في ذلك النماذج اللغوية الكبيرة، في المتصفّح.


  1. تشين-يو لين 2004. ROUGE: حزمة لتقييم الملخصات تلقائيًا في Text Summarization Branches Out، الصفحات 74-81، برشلونة، إسبانيا. رابطة اللغويات الحسابية 

  2. كيشور بابيني، وسليم روكوس، وتود وارد، ووي-جينغ زهو 2002. BLEU: وهي طريقة لتقييم الترجمة الآلية تلقائيًا. في Proceedings of the 40th Annual Meeting on Association for Computational Linguistics (ACL '02). 

  3. موسومي أكتر، ونامان بانسال، وشوبرا كانتي كارماكر 2022. إعادة النظر في التقييم التلقائي لمهمة التلخيص الاستخراجي: هل يمكننا تحقيق نتائج أفضل من ROUGE؟ في "نتائج جمعية اللغويات الحسابية: ACL 2022"، الصفحات 1547-1560، دبلن، أيرلندا. رابطة اللغويات الحاسوبية 

  4. دانيال دويتش ودان روث 2021 فهم مدى قدرة مقاييس جودة المحتوى على قياس جودة المعلومات في الملخصات في "محاضرات المؤتمر الخامس والعشرون حول التعلّم الآلي للغة الطبيعية"، الصفحات 300-309، على الإنترنت. رابطة اللغويات الحسابية