مَعلمات الإعداد التي توفّرها Google

يشتمل كل موصل على ملف تهيئة مرتبط يحتوي على المعلمات التي يستخدمها الموصل، مثل رقم تعريف المستودع. يتم تعريف المَعلمات على أنّها أزواج من قيم المفتاح/القيمة، مثل api.sourceId=1234567890abcdef

تحتوي حزمة تطوير البرامج (SDK) لخدمة Google Cloud Search على العديد من الإعدادات التي توفّرها Google. المعاملات التي تستخدمها موصلات مختلفة. من بين مَعلمات الإعداد التي توفّرها Google، كما يتعيّن تحديد مَعلمات الوصول إلى مصدر البيانات فقط في ملف الإعداد. لن تحتاج إلى إعادة تحديد المعلمات التي توفرها Google في ملف الضبط إلا إذا أردت إلغاء القيم التلقائية.

يصِف هذا المرجع مَعلمات الإعداد التي توفّرها Google.

مثال على ملف الإعداد

يوضّح المثال التالي ملف إعداد هوية يشتمل على أزواج المفتاح/القيمة الخاصة بالمَعلمة.

#
# Configuration file sample
#
api.sourceId=1234567890abcdef
api.identitySourceId=0987654321lmnopq
api.serviceAccountPrivateKeyFile= ./PrivateKey.json

#
# Traversal schedules
#
schedule.traversalIntervalSecs=7200
schedule.incrementalTraversalIntervalSecs=600
#
# Default ACLs
#
defaultAcl.mode=fallback
defaultAcl.public=true
  

المَعلمات الشائعة

يسرد هذا القسم مَعلمات الضبط المطلوبة والاختيارية التي يتم ضبطها بشكل شائع. إذا لم تغيير القيم للمعلمات الاختيارية، يستخدم الموصل القيم الافتراضية التي تقدمها حزمة SDK.

الوصول إلى مصدر البيانات

يسرد الجدول التالي جميع المَعلمات المطلوبة للظهور في أحد الإعدادات. الملف. تعتمد المعلمات التي تستخدمها على نوع الموصّل الذي تنشئه (أداة ربط المحتوى). أو موصِّل الهوية).

الإعدادات المعلمة
رقم تعريف مصدر البيانات api.sourceId=1234567890abcdef

تشترط الموصل هذه المعلمة لتحديد موقع المستودع. تحصل على هذه القيمة عندما إضافة مصدر بيانات إلى البحث يجب أن تكون هذه المَعلمة في ملفات ضبط المُوصِّل.

رقم تعريف مصدر الهوية api.identitySourceId=0987654321lmnopq

هذه المَعلمة مطلوبة من خلال موصِّلات الهوية لتحديد موقع مصدر هوية خارجي. لقد حصلت على هذه القيمة عندما ربط هويات المستخدمين في Cloud Search يجب أن تكون هذه المَعلمة في جميع ملفات إعداد موصِّلات الهوية.

ملف المفتاح الخاص لحساب الخدمة api.serviceAccountPrivateKeyFile=./PrivateKey.json

تحتوي هذه المعلمة على المفتاح الخاص المطلوب من الوصول إلى المستودع. لقد حصلت على هذه القيمة عندما تم إعداد الوصول إلى Google Cloud Search REST API. يجب أن تكون هذه المعلمة في جميع ملفات الإعداد.

رقم تعريف حساب الخدمة api.serviceAccountId=123abcdef4567890

تحدّد هذه المَعلمة حساب الخدمة. رقم التعريف يُسمح باستخدام قيمة السلسلة الفارغة التلقائية فقط عندما يتضمّن ملف الإعداد. يحدد معلمة ملف المفتاح الخاص. هذه المعلمة مطلوبة إذا كان ملف المفتاح الخاص ليس مفتاح JSON.

رقم تعريف حساب Google Workspace api.customerId=123abcdef4567890

تحدّد هذه المَعلمة رقم تعريف الحساب لحساب المؤسسة على Google Workspace. لقد حصلت على هذه القيمة عند ربط المستخدم الهويات في Cloud Search هذه المعلمة مطلوبة عند مزامنة المستخدمين باستخدام موصِّل الهوية.

عنوان URL الجذر api.rootUrl=baseURLPath

تحدّد هذه المَعلمة مسار عنوان URL لقاعدة خدمة الفهرسة.

والقيمة الافتراضية لهذه المعلمة هي سلسلة فارغة يتم تحويلها إلى https://cloudsearch.googleapis.com

الجداول الزمنية للاجتياز

تحدد معلمات الجدولة عدد مرات انتظار الموصل بين واجتيازات الاختبار.

الإعدادات المعلمة
الاجتياز الكامل عند بدء تشغيل الموصل schedule.performTraversalOnStart=true|false

يُجري الموصل اجتيازًا كاملاً عند بدء تشغيل الموصل، بدلاً من في انتظار انتهاء الفاصل الزمني الأول. القيمة التلقائية هي true..

الاجتياز الكامل بعد فاصل زمني schedule.traversalIntervalSecs=intervalInSeconds

يُجري الموصل عملية اجتياز كاملة بعد فاصل زمني محدد. تحديد الفاصل الزمني بين عمليات الاجتياز بالثواني. القيمة التلقائية هي 86400. (عدد الثواني في يوم واحد).

الخروج بعد اجتياز واحد connector.runOnce=true|false

يُجري الموصل اجتيازًا كاملاً مرة واحدة، ثم يخرج. يجب أن تقتصر هذه المعلمة أن يتم ضبطها على true إذا كنت تستخدم استراتيجية الاجتياز الكامل؛ بطاقة بيانات متجر ورسم بياني تتطلب عمليات اجتياز متعددة لاكتشاف التغييرات وفهرسة المحتوى. الإعداد التلقائي هي false (يُرجى عدم الخروج بعد اجتياز واحد).

اجتياز متزايد بعد فاصل زمني schedule.incrementalTraversalIntervalSecs=intervalInSeconds

يقوم الموصل بإجراء اجتياز تزايدي بعد فاصل محدد. تحديد الفاصل الزمني بين عمليات الاجتياز بالثواني القيمة الافتراضية هي 300 (عدد الثواني في 5 دقائق)

الفواصل الزمنية المجدوَلة لقائمة الاستطلاع schedule.pollQueueIntervalSecs=interval_in_seconds

الفاصل الزمني بين الفواصل الزمنية المجدولة مسبقًا لقائمة الاستطلاع (بالثواني). يتم استخدام هذه المعلومات من خلال موصل اجتياز بطاقة بيانات المتجر فقط. القيمة التلقائية هي 10..

قوائم التحكّم بالوصول

يتحكم الموصل في الوصول إلى العناصر باستخدام قوائم التحكم في الوصول. معلمات متعددة بحماية وصول المستخدم إلى السجلات المفهرسة باستخدام قوائم التحكم في الوصول.

إذا كان المستودع يحتوي على معلومات فردية لقائمة التحكم بالوصول مرتبطة بكل عنصر، تحميل جميع معلومات قائمة التحكم بالوصول (ACL) للتحكُّم في الوصول إلى العناصر داخل Cloud Search. في حال حذف يوفر مستودعك معلومات جزئية أو لا توفر معلومات قائمة التحكم بالوصول، فيمكنك تقديم معلومات قائمة التحكم بالوصول (ACL) في المعلمات التالية، والتي توفرها حزمة SDK وصلة البيانات.

الإعدادات المعلمة
وضع ACL defaultAcl.mode=mode

يحدد وقت تطبيق قائمة التحكم بالوصول الافتراضية. قيم صالحة:

  • none: عدم استخدام قائمة التحكم بالوصول التلقائية (في هذا الوضع، تكون السجلات غير قابل للبحث ما لم تحدد قوائم التحكم بالوصول الفردية)
  • fallback: استخدام قائمة التحكم بالوصول التلقائية فقط في حالة عدم وجود قائمة التحكم بالوصول ACL بالفعل
  • append: إضافة قائمة التحكم بالوصول التلقائية إلى قائمة التحكم بالوصول الحالية
  • override: استبدال قائمة التحكم بالوصول الحالية بقائمة التحكم بالوصول التلقائية

الوضع التلقائي هو none.

ACL العلني التلقائي defaultAcl.public=true|false

يتم تعيين قائمة التحكم بالوصول الافتراضية المستخدمة للمستودع بأكمله إلى الوصول إلى النطاق العام. القيمة التلقائية هي false. .

برامج القراءة الشائعة لمجموعة ACL defaultAcl.readers.groups=google:group1@mydomain.com, group2
برامج قراءة ACL الشائعة defaultAcl.readers.users=user1, user2, google:user3@mydomain.com
قراء المجموعات الذين تم رفضهم لقائمة ACL الشائعة defaultAcl.denied.groups=group3
القرّاء الذين تم رفضهم في سياسة Acl الشائعة defaultAcl.denied.users=user4, user5
الوصول الكامل إلى النطاق لتحديد إمكانية وصول جميع المستخدمين إلى كل سجلّ مُفهرَس في المجال، قم بتعيين المعاملين التاليين مع القيم:
  • defaultAcl.mode=override
  • defaultACL.public=true
قائمة التحكم بالوصول المحددة (ACL) الشائعة لتحديد قائمة واحدة للتحكم في الوصول لكل سجل من سجلات مستودع البيانات، قم بتعيين جميع قيم المعلّمات التالية:
  • defaultAcl.mode=fallback
  • defaultAcl.public=false
  • defaultAcl.readers.groups=google:group1@mydomain.com, group2 code>
  • defaultAcl.readers.users=user1@mydomain.com, user2, google:user3@mydomain.com
  • defaultAcl.denied.groups=group3
  • defaultAcl.denied.users=user4, user5

    يتم الافتراض أن كل مستخدم ومجموعة محددة هو نطاق محلي محدد مستخدم/مجموعة ما لم تكن مسبوقة بـ "google:" (الثابت الحرفي).

    المجموعة أو المستخدم التلقائيان هو سلسلة فارغة. إدخال مَعلمات المستخدمين والمجموعات فقط إذا تم ضبط defaultAcl.public على false. لإدراج عدة عناصر المستخدمين والمستخدمين، استخدم قوائم مفصولة بفواصل.

    إذا تم ضبط defaultAcl.mode على none، ستصبح السجلّات غير قابل للبحث بدون قوائم التحكم بالوصول الفردية المحددة.

مَعلمات ضبط البيانات الوصفية

بعض البيانات الوصفية للعنصر قابلة للتهيئة. يمكن للموصلات تعيين حقول بيانات وصفية قابلة للتهيئة أثناء الفهرسة. إذا لم يضبط الموصِّل حقلاً، يتم استخدام المَعلمات في ملف الإعداد. لضبط المجال.

يتضمن ملف الإعداد سلسلة من مَعلمات إعداد البيانات الوصفية المُسمّاة المُشار إليها باستخدام لاحقة .field، مثل itemMetadata.title.field=movieTitle إذا كانت هناك قيمة لهذه المعلمات، يتم استخدامها لتهيئة حقل بيانات التعريف. إذا لم تكن هناك قيمة باسم معلمة البيانات الوصفية، يتم تهيئة بيانات التعريف باستخدام معلمة لاحقة واحدة (.defaultValue).

يعرض الجدول التالي مَعلمات ضبط البيانات الوصفية.

الإعداد المعلَمة
العنوان itemMetadata.title.field=movieTitle
itemMetadata.title.defaultValue=Gone with the Wind
عنوان العنصر إذا لم يتم ضبط title.field على قيمة، يتم ضبط قيمة يتم استخدام title.defaultValue.
عنوان URL لمستودع المصدر itemMetadata.sourceRepositoryUrl.field=url
itemMetadata.sourceRepositoryUrl.defaultValue=https://www.imdb.com/title/tt0031381/
عنوان URL الخاص بالسلعة المستخدَم في نتائج البحث يمكنك للتو ضبط defaultValue على تعليق عنوان URL للمستودع بأكمله، مثل ما إذا كان التكرار عبارة عن ملف CSV ويوجد واحد فقط عنوان URL لكل سلعة إذا لم يتم ضبط sourceRepositoryUrl.field إلى قيمة، يتم استخدام قيمة sourceRepositoryUrl.defaultValue.
اسم الحاوية itemMetadata.containerName.field=containerName
itemMetadata.containerName.defaultValue=myDefaultContainerName
اسم حاوية العنصر، مثل اسم دليل أو مجلد نظام الملفات. في حال حذف لم يتم ضبط containerName.field على قيمة، فإن قيمة يتم استخدام containerName.defaultValue.
نوع الكائن itemMetadata.objectType.field=type
itemMetadata.objectType.defaultValue=movie
نوع الكائن الذي تستخدمه الموصل، كما هو محدد في السمة المخطط. لن يفهرس الموصِّل أي بيانات منظَّمة إذا لم يتم تحديد هذه السمة.
إذا لم يتم تعيين objectType.field على قيمة، فإن قيمة يتم استخدام objectType.defaultValue.
وقت الإنشاء itemMetadata.createTime.field=releaseDate
itemMetadata.createTime.defaultValue=1940-01-17
الطابع الزمني لإنشاء المستند إذا لم يتم ضبط createTime.field على قيمة، سيتم استخدام قيمة createTime.defaultValue.
وقت التعديل itemMetadata.updateTime.field=releaseDate
itemMetadata.updateTime.defaultValue=1940-01-17
الطابع الزمني لآخر تعديل للعنصر إذا لم يتم ضبط updateTime.field على قيمة، يتم استخدام قيمة updateTime.defaultValue.
لغة المحتوى itemMetadata.contentLanguage.field=languageCode
itemMetadata.contentLanguage.defaultValue=en-US
لغة المحتوى للمستندات التي تتم فهرستها: إذا كانت السمة contentLanguage.field لم يتم تعيينه على قيمة، فسيتم استخدام قيمة contentLanguage.defaultValue.
نوع MIME itemMetadata.mimeType.field=mimeType
itemMetadata.mimeType.defaultValue=image/bmp
نوع MIME الأصلي لـ ItemContent.content في مستودع المصدر. الحد الأقصى للطول هو 256 حرفًا. إذا لم يتم ضبط mimeType.field على قيمة، يتم ضبط قيمة يتم استخدام mimeType.defaultValue.
البيانات الوصفية لجودة البحث itemMetadata.searchQualityMetadata.quality.field=quality
itemMetadata.searchQualityMetadata.quality.defaultValue=1
إشارة إلى جودة السلعة، تُستخدَم للتأثير في جودة البحث يجب أن تكون القيمة بين 0.0 (أدنى جودة) و1.0 (أعلى جودة) القيمة التلقائية هي 0.0. إذا كانت لم يتم ضبط quality.field على قيمة، يمكن يتم استخدام quality.defaultValue.
تجزئة itemMetadata.hash.field=hash
itemMetadata.hash.defaultValue=f0fda58630310a6dd91a7d8f0a4ceda2
قيمة التجزئة التي يوفّرها المتصل بواجهة برمجة التطبيقات. ويمكن استخدام ذلك مع items.push لحساب الحالة المعدَّلة. الحدّ الأقصى للطول هو 2048. الأحرف. إذا لم يتم ضبط hash.field على قيمة، يتم ضبط قيمة يتم استخدام hash.defaultValue.

تنسيقات التاريخ والوقت

تحدد تنسيقات التاريخ والوقت التنسيقات المتوقعة في سمات البيانات الوصفية. إذا كان ملف التهيئة لا يحتوي على هذه المعلمة، فسيتم استخدام القيم الافتراضية. يعرض الجدول التالي هذه المَعلمة.

الإعداد المعلَمة
تنسيقات إضافية للتاريخ والوقت structuredData.dateTimePatterns=MM/dd/uuuu HH:mm:ssXXX
قائمة مفصولة بفواصل منقوطة تضم java.time.format.DateTimeFormatter إضافية أنماط. يتم استخدام الأنماط عند تحليل قيم السلسلة لأي حقل تاريخ أو وقت في بيانات التعريف أو المخطط. تكون القيمة التلقائية هي قائمة فارغة، ولكن يجب استخدام RFC 3339 وRFC 1123. يتم دعم التنسيقات دائمًا.

البيانات المنظَّمة

توفّر واجهة Cloud Search Indexing API خدمة المخطط التي يمكنك استخدامها من أجل تخصيص كيفية فهرسة Cloud Search لبياناتك وعرضها فيها إذا كنت تستخدم مخطّط المستودع المحلي، يجب تحديد مخطّط البيانات المنظَّمة على الجهاز اسم المخطط.

الإعدادات المعلمة
اسم المخطط المحلي structuredData.localSchema=mySchemaName

تتم قراءة اسم المخطط من مصدر البيانات ويُستخدم للمستودع البيانات المهيكلة.

القيمة التلقائية هي سلسلة فارغة.

جودة البحث والمحتوى

بالنسبة إلى المستودعات التي تشتمل على محتوى سجلّ أو محتوى يستند إلى حقل (مثل نظام إدارة علاقات العملاء أو CVS أو قاعدة بيانات)، تسمح حزمة تطوير البرامج (SDK) بتنسيق HTML التلقائي لحقول البيانات. موصل يحدد حقول البيانات في بداية تنفيذ الموصل، ثم تستخدم قالب محتوى لتنسيق كل سجل بيانات قبل تحميله إلى Cloud Search.

يحدد نموذج المحتوى أهمية كل قيمة حقل للبحث. رمز HTML <title> مطلوبًا وتحديده على أنه الأولوية القصوى. يمكنك تحديد مستويات أهمية جودة البحث في جميع حقول المحتوى الأخرى: مرتفع أو متوسط أو منخفض. أي حقل محتوى غير معرّف في فئة معينة القيمة الافتراضية على أولوية منخفضة.

الإعدادات المعلمة
عنوان HTML للمحتوى contentTemplate.templateName.title=myTitleField

حقل عنوان HTML للمحتوى وحقل أعلى جودة للبحث. هذه المعلمة مطلوبة وذلك فقط إذا كنت تستخدم نموذج محتوى HTML. القيمة التلقائية هي حقل السلسلة.

جودة بحث عالية لحقول المحتوى contentTemplate.templateName.quality.high=hField1,hField2

يتم منح حقول المحتوى أولوية بحث عالية. القيمة التلقائية هي سلسلة فارغة.

جودة بحث متوسطة عن حقول المحتوى contentTemplate.templateName.quality.medium=mField1,mField2

يتم منح حقول المحتوى أولوية بحث متوسطة. القيمة التلقائية هي سلسلة فارغة.

جودة بحث منخفضة عن حقول المحتوى contentTemplate.templateName.quality.low=lField1,lField2

تحظى حقول المحتوى بأولوية بحث منخفضة. القيمة التلقائية هي سلسلة فارغة.

حقول محتوى غير محدّدة contentTemplate.templateName.unmappedColumnsMode=value

كيفية تعامل الموصِّل مع حقول المحتوى غير المحددة. القيم الصالحة هي:

  • APPEND: إلحاق حقول محتوى غير محدّدة بالنموذج
  • IGNORE: تجاهل حقول المحتوى غير المحدَّدة

    تكون القيمة التلقائية APPEND.

تضمين أسماء الحقول في نموذج HTML contentTemplate.templateName.includeFieldName=true|false

لتحديد ما إذا كان سيتم تضمين أسماء الحقول مع بيانات الحقول في ملف HTML القالب. القيمة التلقائية هي true وتجعل أسماء الحقول قابلة للبحث. كجزء من بيانات المحتوى.

المَعلمات غير المألوفة

نادرًا ما تحتاج إلى ضبط المعلمات المدرجة في هذا القسم. الإعدادات الافتراضية للمعلمات هي من أجل تحقيق الأداء الأمثل. لا توصي Google بتعيين هذه المعلمات على مختلفة عن قيمها الافتراضية دون متطلبات محددة داخل المستودع.

إعداد الخادم الوكيل

تسمح لك حزمة تطوير البرامج (SDK) بإعداد الموصِّل لاستخدام خادم وكيل للاتصالات الصادرة.

المعلمتان transport.proxy.hostname وtransport.proxy.port هما المطلوبة لتفعيل النقل من خلال خادم وكيل. قد تكون المَعلمات الأخرى مطلوبة إذا كان الخادم الوكيل يتطلب المصادقة أو يعمل باستخدام بروتوكول SOCKS بدلاً من HTTP. في حال حذف لم يتم ضبط transport.proxy.hostname، لذا لن تستخدم حزمة تطوير البرامج (SDK) خادمًا وكيلاً.

الإعدادات المعلمة
اسم المضيف transport.proxy.hostname=hostname

اسم المضيف للخادم الوكيل. هذه المعلمة مطلوبة عند استخدام خادم وكيل.

المنفذ transport.proxy.port=port

رقم المنفذ للخادم الوكيل. هذه المعلمة مطلوبة عند استخدام خادم وكيل.

نوع الخادم الوكيل transport.proxy.type=type

نوع الخادم الوكيل. القيم الصالحة هي:

  • HTTP: يقبل الخادم الوكيل الطلبات ويعيد توجيهها عبر بروتوكول HTTP.
  • SOCKS: يقبل الخادم الوكيل الحزم ويعيد توجيهها عبر بروتوكول SOCKS.

تكون القيمة التلقائية HTTP.

اسم المستخدم transport.proxy.username=username

اسم المستخدم الذي سيتم استخدامه عند إنشاء رمز مميز لتفويض الخادم الوكيل. هذه المعلمة اختيارية، ويجب ضبطها فقط إذا كان الخادم الوكيل يتطلب المصادقة.

كلمة المرور transport.proxy.password=password

كلمة المرور التي سيتم استخدامها عند إنشاء رمز مميز لتفويض الخادم الوكيل. هذه المعلمة اختيارية، ويجب ضبطها فقط إذا كان الخادم الوكيل يتطلب المصادقة.

أدوات الاجتياز

تُمكّنك حزمة تطوير البرامج (SDK) من تحديد برامج اجتياز فردية متعددة للسماح اجتيازات متوازية لمستودع البيانات. تستخدم موصِّلات نماذج حزمة تطوير البرامج (SDK) هذا الجديدة.

الإعدادات المعلمة
حجم مجموعة سلاسل المحادثات traverse.threadPoolSize=size

عدد السلاسل التي ينشئها الموصل للسماح بالمعالجة المتوازية. حاسمة مكرر واحد يجلب العمليات بشكل متسلسل (عادةً كائنات RepositoryDoc)، ولكن تتم معالجة طلبات البيانات من واجهة برمجة التطبيقات بالتوازي باستخدام هذا العدد من سلاسل المحادثات.

تكون القيمة التلقائية 5.

حجم القسم traverse.partitionSize=batchSize

عدد ApiOperation() لتتم معالجتها على دفعات قبل استرجاع APIOperation إضافية.

تكون القيمة التلقائية 50.

طلبات استطلاع أداة الاجتياز

يمثل جوهر قائمة انتظار الفهرسة في Cloud Search قائمة انتظار أولوية تحتوي لكل عنصر معروف بوجوده. يمكن لأداة ربط البيانات طلب إجراء استطلاع. من واجهة برمجة تطبيقات الفهرسة. يحصل طلب الاستطلاع على الأولوية القصوى للإدخالات من قائمة انتظار الفهرسة.

يستخدِم نموذج موصِّل بيانات المنتج في حزمة تطوير البرامج المَعلمات التالية من أجل تحديد معايير الاستطلاع.

الإعدادات المعلمة
برنامج اجتياز المستودع repository.traversers=t1, t2, t3, ...

تنشئ أداة اجتياز فردية واحدة أو أكثر حيث تكون t1 وt2 وt3 و ... هو الاسم الفريد لكل منهما. لكل اجتياز مُسمّى مجموعة خاصة من الإعدادات والتي يتم تحديدها باستخدام الاسم الفريد للاجتياز، مثل "traversers.t1.hostload" وtraversers.t2.hostload"

قائمة الانتظار المطلوب استطلاعها traverser.pollRequest.queue=mySpecialQueue

يمكنك وضع الأسماء في قائمة الانتظار التي يستطلعها هذا الفاصل. الإعداد الافتراضي هو سلسلة فارغة (يعني ذلك "تلقائي").

traverser.t1.pollRequest.queue=mySpecialQueue

عندما يكون لديك العديد من الاجتيازات، يمكنك ضبط حالات العنصر لكل اجتياز. (حيث تمثل t1 أداة اجتياز محددة).

سلوك الاستطلاع traverser.pollRequest.limit=maxItems

الحد الأقصى لعدد العناصر المطلوب عرضها من طلب الاستطلاع. القيمة التلقائية هي 0 (ما يعني الحد الأقصى لواجهة برمجة التطبيقات).

traverser.t1.pollRequest.limit=limit

عندما يكون لديك العديد من الاجتيازات، يمكنك ضبط حالات العنصر لكل اجتياز. (حيث تمثل t1 أداة اجتياز محددة).

حالة العنصر traverser.pollRequest.statuses=statuses

يشير هذا المصطلح إلى حالات العنصر المحدّد التي يعرضها الاجتياز هذا، حيث يمكن إدخال statuses. أي مجموعة من MODIFIED, NEW_ITEM (مفصولة بفواصل)، الإعداد التلقائي هو سلسلة فارغة (تضمين جميع قيم الحالة).

traverser.t1.pollRequest.statuses=statusesForThisTraverser

عند توفُّر عدة أدوات اجتياز، يمكنك ضبط حالات العنصر لكل أداة اجتياز (حيث تكون t1، يمثل فاصلاً محددًا).

تحميل المضيف traverser.hostload=threads

الحد الأقصى لعدد سلاسل المحادثات المتوازية النشطة المتاحة للاستطلاع. الإعداد التلقائي القيمة هي 5.

traverser.t1.hostload=threadsForThisTraverser

عند توفُّر عدة أدوات اجتياز، يمكنك ضبط حالات العنصر لكل أداة اجتياز (حيث تكون t1، يمثل فاصلاً محددًا).

عملية استبعاد للقناة لمهلة معيّنة traverser.timeout=timeout

قيمة المهلة لمقاطعة محاولة استطلاع الاجتياز هذه.

تكون القيمة التلقائية 60.

traverser.t1.timeout=timeoutForThisTraverser

عند توفُّر عدة أدوات اجتياز، يمكنك ضبط حالات العنصر لكل أداة اجتياز (حيث تكون t1، يمثل فاصلاً محددًا).

traverser.timeunit=timeoutUunit

وحدات المهلة. القيم الصالحة هي SECONDS, MINUTES,

traverser.t1.timeunit=timeoutUnit

عند توفُّر عدة أدوات اجتياز، يمكنك ضبط حالات العنصر لكل أداة اجتياز (حيث تكون t1، يمثل فاصلاً محددًا).

في معظم الحالات، يستخدم الموصِّل الذي يستخدم نموذج موصِّل بطاقة بيانات حزمة SDK فقط تتطلب مجموعة واحدة من المَعلَمات لإجراء الاستطلاع. في بعض الحالات، قد تحتاج إلى تحدد أكثر من معيار استطلاع واحد إذا كانت خوارزمية الاجتياز تتطلب فصل معالجة العنصر باستخدام قوائم انتظار مختلفة، على سبيل المثال.

في هذه الحالة، يمكنك تحديد مجموعات متعددة من الاستطلاعات. المعلَمات. ابدأ بتحديد أسماء مجموعات المَعلمات باستخدام repository.traversers لكل اسم فاصل محدّد، ملف تهيئة مع المعلمات في الجدول أعلاه استبدال t1 باسم الاجتياز. يؤدي هذا إلى إنشاء مجموعة من الاستطلاعات لكل فاصل محدَّد.

نقاط التفتيش

النقطة المرجعية مفيدة لتتبع حالة الاجتياز التدريجي.

الإعدادات المعلمة
دليل نقاط التفتيش connector.checkpointDirectory=/path/to/checkpoint

تحدّد المسار إلى الدليل المحلي لاستخدامه في نقاط فحص الاجتياز التزايدي والكامل.

تحميل المحتوى

يتم تحميل محتوى العنصر إلى Cloud Search باستخدام العنصر عند لم يتخطى حجم المحتوى الحد الأقصى المحدد. إذا كان حجم المحتوى يتجاوز الحد المسموح به، يتم تحميل المحتوى بشكل منفصل عن ملفات بيانات التعريف والبيانات المهيكلة.

الإعدادات المعلمة
الحد الأدنى للمحتوى api.contentUploadThresholdBytes=bytes

الحد الأدنى للمحتوى الذي يحدّد ما إذا كان سيتم تحميله "مضمّنًا" مع العنصر مقابل استخدام تحميل منفصل.

القيمة التلقائية هي 100000 (حوالي 100 كيلوبايت).

الحاويات

يستخدم نموذج الموصل الكامل خوارزمية تتضمن مفهوم تبديل قائمة انتظار مصدر البيانات المؤقتة لاكتشاف السجلات المحذوفة في قاعدة البيانات. وهذا يعني أنه في كل عملية اجتياز كاملة، تظهر السجلات التي تم استرجاعها، وهي موجودة في قائمة انتظار جديدة، يمكنك استبدال جميع سجلات Cloud Search الحالية التي تمت فهرستها من الاجتياز السابق، وهو موجود في قائمة انتظار قديمة.

الإعدادات المعلمة
علامة اسم الحاوية traverse.queueTag=instance

لتشغيل مثيلات متعددة من الموصل بالتوازي لفهرسة بيانات شائعة (سواء في مستودعات بيانات مختلفة أو في أجزاء منفصلة من مستودع البيانات) دون أن تتداخل مع بعضها البعض، يمكنك تعيين حاوية فريدة علامة الاسم إلى كل عملية تشغيل للموصل. تمنع علامة الاسم الفريدة توصيل الموصِّل مثال من حذف سجلات شخص آخر.

يتم إلحاق علامة الاسم بمعرّف قائمة انتظار تبديل موصل الاجتياز الكامل.

إيقاف رصد الحذف traverse.useQueues=true|false

يشير إلى ما إذا كان الموصل يستخدم منطق تبديل قائمة الانتظار لاكتشاف الحذف.

إنّ القيمة التلقائية هي true، وهي تحدد أنّه يجب ضبط قوائم الانتظار استخدام البيانات المختلفة.

ملاحظة: تنطبق مَعلمة الضبط هذه على الموصِّلات فقط. جارٍ تنفيذ نموذج FullTraversalConnector.

سياسة الدفعات

تتوافق حزمة تطوير البرامج (SDK) مع سياسة مجمَّعة تتيح لك تنفيذ ما يلي: الإجراءات:

  • الطلبات المجمّعة
  • تحديد عدد الطلبات في قائمة انتظار مجمّعة
  • إدارة الدفعات التي يتم تنفيذها بشكل متزامن
  • مسح الطلبات المجمّعة

تعمل حزمة تطوير البرامج (SDK) على تجميع طلبات الموصِّل معًا لتسريع سرعة معالجة البيانات أثناء. عمليات التحميل. يتم تشغيل SDK لتحميل مجموعة من الطلبات عن طريق إما عدد الطلبات أو المهلة، أيهما أقرب. على سبيل المثال، إذا كانت قيمة انتهاء مدة تأخير الدفعة بدون الوصول إلى حجم الدفعة أو إذا عدد العناصر في الدفعة قبل انتهاء وقت التأخير، سيتم تشغيل التحميل المجمَّع.

الإعدادات المعلمة
الطلبات المجمّعة batch.batchSize=batchSize

تجميع الطلبات معًا. تكون القيمة التلقائية 10.

عدد الطلبات في قائمة انتظار مجمّعة batch.maxQueueLength=maxQueueLength

الحدّ الأقصى لعدد الطلبات في قائمة انتظار مجمّعة للتنفيذ. القيمة التلقائية هي 1000..

تنفيذ الدفعات بشكل متزامن batch.maxActiveBatches=maxActiveBatches

عدد الدفعات التي يتم تنفيذها بشكل متزامن المسموح به. تكون القيمة التلقائية 20.

مسح الطلبات المجمّعة تلقائيًا batch.maxBatchDelaySeconds=maxBatchDelay

عدد الثواني التي يجب الانتظار خلالها قبل تحميل الطلبات المجمّعة تنقَّلت تلقائيًا. تشير رسالة الأشكال البيانية والقيمة التلقائية هي 5.

مسح الطلبات المجمّعة عند إيقاف التشغيل batch.flushOnShutdown=true|false

يتم مسح الطلبات المجمّعة أثناء إيقاف الخدمة. القيمة التلقائية هي true.

معالِجات الاستثناء

تحدد معلمات معالِجات الاستثناء كيفية تقدم أداة الاجتياز بعد استثناءً.

الإعدادات المعلمة
تعليمات أداة الاجتياز في حال حدوث خطأ traverse.exceptionHandler=exceptions

الطريقة التي يجب أن يعمل بها الاجتياز بعد طرح استثناء. القيم الصالحة هي:

  • 0--يتم إلغاء الاجتياز دائمًا بعد مواجهة استثناء
  • num_exceptions (على سبيل المثال، 10)-- يتم إلغاء العملية بعد الاجتياز لمواجهة num_exceptions المحددة.

    القيمة التلقائية هي 0 (الإلغاء دائمًا عند حدوث خطأ).

  • ignore--تجاهل الخطأ
وقت الانتظار بين الاستثناءات abortExceptionHander.backoffMilliSeconds=backoff

وقت التراجع بالمللي ثانية للانتظار بين استثناءات المعالِج التي تم رصدها (تُستخدم عادةً عند اجتياز مستودع). تكون القيمة التلقائية 10.