الاستدلال المختلط

توفّر Google مجموعة كبيرة من نماذج الذكاء الاصطناعي وواجهات برمجة التطبيقات الرائدة في المجال للاستنتاج المستنِد إلى السحابة الإلكترونية وعلى الجهاز فقط. يتيح لك الاستنتاج المختلط موازنة أحمال عمل الذكاء الاصطناعي بسلاسة بين الجهاز المحلي والسحابة الإلكترونية، ما يؤدي إلى تحسين الأداء والتكلفة والتوافر.

يوفّر الاستنتاج المختلط ميزتَين أساسيتَين لتطبيق Android:

  • تحقيق أقصى قدر من الوصول: تعمل النماذج المستضافة على السحابة الإلكترونية كحلّ احتياطي مهمّ عندما تكون النماذج على الجهاز فقط، مثل Gemini Nano، غير متاحة بسبب قيود على أجهزة الجهاز أو نظام التشغيل. يساعد ذلك في ضمان بقاء ميزات الذكاء الاصطناعي في تطبيقك تعمل على أوسع نطاق ممكن من أجهزة المستخدمين.
  • التكلفة والإمكانات بلا إنترنت: تساعد النماذج على الجهاز فقط في ضمان عمل ميزات الذكاء الاصطناعي بسلاسة عندما يكون المستخدم غير متصل بالإنترنت. بالإضافة إلى ذلك، يساعد تفريغ المهام الروتينية إلى الجهاز المحلي في خفض تكاليف الاستنتاج في السحابة الإلكترونية.

في ما يلي مزايا الاستنتاج على الجهاز والاستنتاج في السحابة الإلكترونية، على التوالي:

الاستنتاج على الجهاز فقط الاستنتاج في السحابة الإلكترونية
متاح بلا إنترنت متوافق مع أي جهاز
ما مِن تكلفة للاستنتاج إمكانات النموذج المتقدّمة

خيارات الاستخدام

يمكنك استخدام الاستنتاج المختلط باتّباع الطرق التالية:

واجهة برمجة التطبيقات المختلطة Firebase AI Logic

توفر واجهة برمجة التطبيقات المختلطة Firebase AI Logic واجهة موحدة واحدة لـ تقسيم الاستنتاج بين السحابة الإلكترونية والبيئات على الجهاز فقط.

تتضمّن هذه الواجهة مَعلمة onDeviceConfig توفّر عناصر تحكّم بسيطة لتحديد وضع الاستنتاج وإدارة التوجيه:

  • PREFER_ON_DEVICE: محاولة استخدام النموذج على الجهاز فقط، والرجوع تلقائيًا إلى النموذج المستضاف على السحابة الإلكترونية إذا كان النموذج على الجهاز غير متاح أو غير متوافق مع الطلب.
  • PREFER_IN_CLOUD: محاولة استخدام النموذج المستضاف على السحابة الإلكترونية عندما يكون الجهاز متصلاً بالإنترنت والنموذج متاحًا، والرجوع إلى النموذج على الجهاز فقط إذا كان الجهاز غير متصل بالإنترنت.
  • ONLY_ON_DEVICE: محاولة استخدام النموذج على الجهاز فقط، ولكن يتم طرح استثناء إذا كان غير متاح أو غير متوافق مع الطلب.
  • ONLY_IN_CLOUD: محاولة استخدام النموذج المستضاف على السحابة الإلكترونية عندما يكون الجهاز متصلاً بالإنترنت والنموذج متاحًا، ويتم عرض استثناء في جميع الحالات الأخرى.

val model = Firebase.ai(backend = GenerativeBackend.Companion.googleAI())
    .generativeModel(
        modelName = "gemini-2.5-flash",
        onDeviceConfig = OnDeviceConfig(mode = InferenceMode.Companion.PREFER_ON_DEVICE)
    )

val response = model.generateContent("Write a story about a green robot.")
print(response.text)

للحصول على تفاصيل حول عملية الاستخدام، يُرجى مراجعة مستندات Firebase واستكشاف نموذج الذكاء الاصطناعي المختلط في كتالوج الذكاء الاصطناعي.

التوجيه المخصّص

إذا كان لتطبيقك متطلبات تجارية أو متطلبات خاصة بتجربة المستخدم، يمكنك أيضًا استخدام منطق توجيه مخصّص. يتيح لك ذلك تحديد مسار الاستنتاج بشكل ديناميكي استنادًا إلى عوامل في الوقت الفعلي، مثل:

  • وقت استجابة الشبكة
  • حالة نظام الجهاز (مثل مستويات البطارية وحِمل المعالج)
  • مدى تعقيد طلب بحث المستخدم

تستخدم التطبيقات الرائدة هذا النهج المخصّص للاستنتاج المختلط، وقد استخدمت هذه التطبيقات منطق التوجيه المخصّص الخاص بها لتقديم تجارب موثوقة للذكاء الاصطناعي، بما في ذلك:

  • GBoard: يستخدم Gboard الاستنتاج المختلط المخصّص لتشغيل أدوات الكتابة، مثل التدقيق الإملائي وإعادة الكتابة.

  • Kakao Mobility: أنشأت Kakao Mobility أداة لاستخراج الكيانات باستخدام الاستنتاج المختلط المخصّص لخدمة توصيل الطرود، وتستخرج هذه الأداة تلقائيًا أسماء المستلِمين وعناوينهم وأرقام هواتفهم من الرسائل باللغة الطبيعية لتبسيط نماذج الطلبات.