CSV Bağlayıcısı dağıtma

Bu kılavuz, Google Cloud Search CSV (virgülle ayrılmış değerler) bağlayıcı yöneticileri, yani bağlayıcıyı indirme, yapılandırma, çalıştırma ve izlemekten sorumlu olan kişiler için hazırlanmıştır.

Bu kılavuzda, CSV bağdaştırıcısı dağıtımıyla ilgili temel görevleri gerçekleştirme talimatları yer almaktadır:

  • Google Cloud Search CSV bağlayıcı yazılımını indirme
  • Bağlayıcıyı belirli bir CSV veri kaynağıyla kullanmak için yapılandırma
  • Bağlayıcıyı dağıtma ve çalıştırma

Bu belgedeki kavramları anlamak için Google Workspace, CSV dosyaları ve erişim denetimi listeleri (ACL'ler) ile ilgili temel bilgilere sahip olmanız gerekir.

Google Cloud Search CSV bağlayıcısına genel bakış

Cloud Search CSV bağlayıcısı, virgülle ayrılmış değerler (CSV) içeren tüm metin dosyalarıyla çalışır. CSV dosyası tablo biçimindeki verileri depolar ve dosyanın her satırı bir veri kaydı olur.

Google Cloud Search'in CSV Bağlayıcısı, bir CSV dosyasından tek tek satırları ayıklayıp Cloud Search'in dizine ekleme API'si aracılığıyla Cloud Search'te dizine ekler. Başarıyla dizine eklendikten sonra CSV dosyalarındaki satırları Cloud Search istemcileri veya Cloud Search Query API üzerinden arayabilirsiniz. CSV bağlayıcısı, ACL'leri kullanarak kullanıcıların arama sonuçlarındaki içeriğe erişimini kontrol etmeyi de destekler.

Google Cloud Search CSV bağlayıcısı Linux veya Windows'a yüklenebilir. Google Cloud Search CSV bağlayıcısını dağıtmadan önce aşağıdaki gerekli bileşenlere sahip olduğunuzdan emin olun:

  • Google Cloud Search CSV bağlayıcısını çalıştıran bir bilgisayarda Java JRE 1.8 yüklü olmalıdır.
  • Google Cloud Search ile veri kaynağı arasında ilişki oluşturmak için gereken Google Workspace bilgileri:

    Genellikle alanın Google Workspace yöneticisi bu kimlik bilgilerini sizin için sağlayabilir.

Dağıtım adımları

Google Cloud Search CSV bağlayıcısını dağıtmak için aşağıdaki adımları uygulayın:

  1. Google Cloud Search CSV bağlayıcı yazılımını yükleme
  2. CSV bağlayıcı yapılandırmasını belirtme
  3. Google Cloud Search veri kaynağına erişimi yapılandırma
  4. CSV dosyası erişimini yapılandırma
  5. Dizine eklenecek sütun adlarını, benzersiz anahtar sütunlarını ve tarih/saat sütunlarını belirtin
  6. Tıklanabilir arama sonucu URL'lerinde kullanılacak sütunları belirtme
  7. Meta veri bilgilerini ve sütun biçimlerini belirtme
  8. Veri taramasını planlama
  9. Erişim Kontrol Listesi (EKL) seçeneklerini belirtme

1. SDK'yı yükleme

SDK'yı yerel Maven deponuza yükleyin.

  1. SDK deposunu GitHub'dan kopyalayın.

    $ git clone https://github.com/google-cloudsearch/connector-sdk.git
    $ cd connector-sdk/csv
  2. SDK'nın istediğiniz sürümüne göz atın:

    $ git checkout tags/v1-0.0.3
  3. Bağlayıcıyı oluşturun:

    $ mvn package
  4. Bağlayıcı zip dosyasını yerel yükleme dizininize kopyalayın:

    $ cp target/google-cloudsearch-csv-connector-v1-0.0.3.zip installation-dir
    $ cd installation-dir
    $ unzip google-cloudsearch-csv-connector-v1-0.0.3.zip
    $ cd google-cloudsearch-csv-connector-v1-0.0.3

2. CSV bağlayıcı yapılandırmasını belirtme

Bağlayıcı yöneticisi olarak, CSV bağlayıcısının davranışını ve bağlayıcının yapılandırma dosyasında parametreleri tanımlayan özelliklerini siz kontrol edersiniz. Yapılandırılabilir parametreler şunlardır:

  • Veri kaynağına erişim
  • CSV dosyasının konumu
  • CSV sütun tanımları
  • Benzersiz kimliği tanımlayan sütunlar
  • Geçiş seçenekleri
  • Veri erişimini kısıtlamak için ACL seçenekleri

Bağlantıcının bir CSV dosyasına düzgün şekilde erişmesi ve ilgili içeriği dizine eklemesi için önce yapılandırma dosyasını oluşturmanız gerekir.

Yapılandırma dosyası oluşturmak için:

  1. İstediğiniz bir metin düzenleyiciyi açıp yapılandırma dosyasını adlandırın.
    Aşağıdaki bölümlerde açıklandığı şekilde dosya içeriğine anahtar=değer çiftleri ekleyin.
  2. Yapılandırma dosyasını kaydedip adlandırın.
    Bağlayıcıyı çalıştırmak için ek komut satırı parametresi gerekmemesi amacıyla Google, yapılandırma dosyasını connector-config.properties olarak adlandırmanızı önerir.

Komut satırında yapılandırma dosyası yolunu belirtebildiğiniz için standart bir dosya konumu gerekli değildir. Ancak, bağlayıcıyı izlemeyi ve çalıştırmayı kolaylaştırmak için yapılandırma dosyasını bağlayıcıyla aynı dizinde tutun.

Bağlantıyı sağlayan aracının yapılandırma dosyanızı tanıması için komut satırında dosya yolunu belirtin. Aksi takdirde, bağlayıcı varsayılan dosya adı olarak yerel dizininizdeki connector-config.properties dosyasını kullanır. Komut satırında yapılandırma yolunu belirtme hakkında bilgi edinmek için Cloud Search CSV bağlayıcısını çalıştırma başlıklı makaleyi inceleyin.

3. Google Cloud Search veri kaynağına erişimi yapılandırma

Her yapılandırma dosyasının belirtmesi gereken ilk parametreler, aşağıdaki tabloda gösterildiği gibi Cloud Search veri kaynağına erişmek için gerekenlerdir. Bağlantıcının Cloud Search'a erişimini yapılandırmak için genellikle veri kaynağı kimliği, hizmet hesabı kimliği ve hizmet hesabının özel anahtar dosyasının yoluna ihtiyacınız vardır. Veri kaynağı oluşturmak için gereken adımlar Üçüncü taraf veri kaynaklarını yönetme başlıklı makalede açıklanmıştır.

Yer Parametre
Veri kaynağı kimliği api.sourceId=1234567890abcdef

Zorunlu. Üçüncü taraf veri kaynaklarını yönetme bölümünde açıklandığı gibi, Google Workspace yöneticisi tarafından ayarlanan Google Cloud Search kaynak kimliği.

Hizmet hesabı özel anahtar dosyasının yolu api.serviceAccountPrivateKeyFile=./PrivateKey.json

Zorunlu. Google Cloud Search CSV bağlayıcı erişimi için Google Cloud Search hizmet hesabı anahtar dosyası.

Kimlik kaynağı kimliği api.identitySourceId=x0987654321

Kuruluş dışından kullanıcılar ve gruplar kullanılıyorsa gereklidir. Google Workspace yöneticisi tarafından ayarlanan Google Cloud Search kimlik kaynağı kimliği.

4. CSV dosyası parametrelerini yapılandırma

Bağlayıcının bir CSV dosyasını tarayabilmesi ve dizine ekleme için dosyasındaki verileri ayıklayabilmesi için dosyanın yolunu tanımlamanız gerekir. Dosya biçimini ve dosya kodlamasının türünü de belirtebilirsiniz. Yapılandırma dosyasında CSV dosyası özelliklerini belirtmek için aşağıdaki parametreleri ekleyin.

Yer Parametre
CSV dosyasının yolu csv.filePath=./movie_content.csv

Zorunlu. Dizine ekleme için erişilecek ve içerikleri ayıklanacak CSV dosyasının yolu.

Dosya biçimi csv.format=DEFAULT

Dosyanın biçimi. Olası değerler Apache Commons CSV CSVFormat sınıfından alınmıştır.

Biçim değerleri şunlardır: DEFAULT, EXCEL, INFORMIX_UNLOAD, INFORMIX_UNLOAD_CSV, MYSQL, RFC4180, ORACLE, POSTGRESQL_CSV, POSTGRESQL_TEXT ve TDF. Belirtilmezse Cloud Search DEFAULT değerini kullanır.

Dosya biçimi değiştirici csv.format.withMethod=value

Cloud Search'in dosyayı işleme şekliyle ilgili bir değişiklik. Olası yöntemler, Apache Commons CSV CSVFormat sınıfındandır ve tek bir karakter, dize veya boole değeri alan yöntemleri içerir.

Örneğin, ayırıcı olarak noktalı virgül belirtmek için csv.format.withDelimiter=; kullanın. Boş satırları yoksaymak için csv.format.withIgnoreEmptyLines=true kullanın.

Dosya kodlama türü csv.fileEncoding=UTF-8

Cloud Search dosyayı okurken kullanılacak Java karakter kümesi. Belirtilmemişse Cloud Search, platformun varsayılan karakter kümesini kullanır.

5. Dizine eklenecek sütun adlarını ve benzersiz anahtar sütunlarını belirtin

Bağlantıcının CSV dosyalarına erişip dizine eklemesi için yapılandırma dosyasında sütun tanımları hakkında bilgi sağlamanız gerekir. Yapılandırma dosyası, dizine eklenecek sütun adlarını ve benzersiz anahtar sütunlarını belirten parametreleri içermiyorsa varsayılan değerler kullanılır.

Yer Parametre
Dizine eklenecek sütunlar csv.csvColumns=movieId,movieTitle,description,actors,releaseDate,year,userratings...

CSV dosyasından dizine eklenecek sütun adları. csv.csvColumns ayarlanmazsa CSV dosyasının ilk satırı başlık olarak kullanılır. csv.csvColumns ayarlanırsa CSV'nin ilk satırına göre öncelikli olur. csv.csvColumns değerini ayarladıysanız ve CSV dosyasının ilk satırı sütun adlarının listesiyse ilk satırı veri olarak dizine ekleme denemesini önlemek için csv.skipHeaderRecord=true değerini ayarlamanız gerekir. Varsayılan değerler, dosyadaki başlık satırındaki sütunlardır.

Benzersiz anahtar sütunları csv.uniqueKeyColumns=movieId

Her kaydın benzersiz kimliğini oluşturmak için değerlerinin kullanılacağı CSV sütunları. Belirtilmemişse CSV kaydının karması benzersiz anahtarı olarak kullanılmalıdır. Varsayılan değer, kaydın karma kodudur.

6. Tıklanabilir arama sonucu URL'lerinde kullanılacak sütunları belirtme

Kullanıcı Google Cloud Search'ı kullanarak arama yaptığında, her bir sonucun tıklanabilir URL'lerini içeren bir sonuç sayfası gösterilir. Bu özelliği etkinleştirmek için aşağıdaki tabloda gösterilen parametreyi yapılandırma dosyasına eklemeniz gerekir.

Yer Parametre
Arama sonucu URL'si biçimi url.format=https://mymoviesite.com/movies/{0}

Zorunlu. CSV içeriği için görüntüleme URL'sinin oluşturulacağı biçim.

Arama sonuçları URL parametreleri. url.columns=movieId

Zorunlu. Kaydın görüntüleme URL'sini oluşturmak için değerlerinin kullanılacağı CSV sütun adları.

Kaçınılacak arama sonuçları URL parametreleri url.columnsToEscape=movieId

İsteğe bağlı. Geçerli bir görüntüleme URL'si oluşturmak için değerleri URL'den kaçan CSV sütun adları.

7. Meta veri bilgilerini, sütun biçimlerini, arama kalitesini belirtin

Yapılandırma dosyasına aşağıdakileri belirten parametreler ekleyebilirsiniz:

Meta Veri Yapılandırma Parametreleri

Meta Veri Yapılandırması Parametreleri, öğe meta verilerini doldurmak için kullanılan CSV sütunlarını açıklar. Yapılandırma dosyası bu parametreleri içermiyorsa varsayılan değerler kullanılır. Bu parametreler aşağıdaki tabloda gösterilmektedir.

Ayar Parametre
Başlık itemMetadata.title.field=movieTitle
itemMetadata.title.defaultValue=Gone with the Wind

Belge başlığına karşılık gelen değeri içeren meta veri özelliği. Varsayılan değer boş bir dizedir.

URL itemMetadata.sourceRepositoryUrl.field=url
itemMetadata.sourceRepositoryUrl.defaultValue=https://www.imdb.com/title/tt0031381/
Arama sonuçları için doküman URL'sinin değerini içeren meta veri özelliği.
Oluşturma zaman damgası itemMetadata.createTime.field=releaseDate
itemMetadata.createTime.defaultValue=1940-01-17

Belge oluşturma zaman damgasının değerini içeren meta veri özelliği.

Son değiştirilme zamanı itemMetadata.updateTime.field=releaseDate
itemMetadata.updateTime.defaultValue=1940-01-17

Belgenin son değişiklik zaman damgasının değerini içeren meta veri özelliği.

Belge dili itemMetadata.contentLanguage.field=languageCode
itemMetadata.contentLanguage.defaultValue=en-US

Dizine eklenen dokümanların içerik dili.

Şema nesnesi türü itemMetadata.objectType.field=type
itemMetadata.objectType.defaultValue=movie

Şemada tanımlandığı şekilde, konnektör tarafından kullanılan nesne türü. Bu özellik belirtilmezse bağlayıcı hiçbir yapılandırılmış veriyi dizine eklemez.

Tarih ve saat biçimleri

Tarih/saat biçimleri, meta veri özelliklerinde beklenen biçimleri belirtir. Yapılandırma dosyası bu parametreyi içermiyorsa varsayılan değerler kullanılır. Bu parametre aşağıdaki tabloda gösterilmektedir.

Ayar Parametre
Ek tarih ve saat biçimleri structuredData.dateTimePatterns=MM/dd/uuuu HH:mm:ssXXX
Ek java.time.format.DateTimeFormatter kalıplarının noktalı virgülle ayrılmış listesi. Kalıplar, meta veriler veya şemada herhangi bir tarih veya tarih-saat alanı için dize değerleri ayrıştırılırken kullanılır. Varsayılan değer boş bir listedir ancak RFC 3339 ve RFC 1123 biçimleri her zaman desteklenir.

Sütun biçimleri

Sütun biçimleri, aranabilir içeriğin bir parçası olması gereken sütunlarla ilgili bilgileri belirtir. Yapılandırma dosyası bu parametreleri içermiyorsa varsayılan değerler kullanılır. Bu parametreler aşağıdaki tabloda gösterilmektedir.

Yer Parametre
Üstbilgiyi atlama csv.skipHeaderRecord=true

Boole. CSV dosyasındaki başlık kaydını (ilk satır) yoksayın. csv.csvColumns ayarladıysanız ve CSV dosyasında başlık satırı varsa skipHeaderRecord=true ayarını yapmanız gerekir. Bu, dosyadaki ilk satırın veri olarak dizine eklenmesini engeller. CSV dosyasında başlık satırı yoksa skipHeaderRecord=false değerini ayarlayın. Varsayılan değer false (yanlış) değerini alır.

Çok değerli sütunlar csv.multiValueColumns=genre,actors

CSV dosyasındaki birden çok değere sahip sütun adları. Varsayılan değer boş bir dizedir.

Çok değerli sütunlar için ayırıcı csv.multiValue.genre=;

Çok değerli sütunlar için ayırıcı. Varsayılan ayırıcı virgüldür.

Arama kalitesi

Cloud Search CSV bağlayıcısı, veri alanları için otomatik HTML biçimlendirmesine olanak tanır. Bağlayıcınız, bağlayıcının yürütülmesinin başında veri alanlarını tanımlar ve ardından her veri kaydını Cloud Search'a yüklemeden önce biçimlendirmek için bir içerik şablonu kullanır.

İçerik şablonu, arama için her bir alan değerinin önemini tanımlar. Başlık alanı zorunludur ve en yüksek öncelikli olarak tanımlanır. Diğer tüm içerik alanları için arama kalitesi önem düzeylerini yüksek, orta veya düşük olarak belirleyebilirsiniz. Belirli bir kategoride tanımlanmayan tüm içerik alanları varsayılan olarak düşük öncelikli olur. Bu parametreler aşağıdaki tabloda gösterilmektedir.

Yer Parametre
İçerik başlığı contentTemplate.csv.title=movieTitle

İçerik başlığı, arama kalitesinin en yüksek olduğu alandır.

İçerik alanları için yüksek arama kalitesi contentTemplate.csv.quality.high=actors

Yüksek arama kalitesi değeri verilen içerik alanları. Varsayılan değer boş bir dizedir.

İçerik alanları için düşük arama kalitesi contentTemplate.csv.quality.low=genre

Düşük arama kalitesi değeri verilen içerik alanları. Varsayılan değer boş bir dizedir.

İçerik alanları için orta düzey arama kalitesi contentTemplate.csv.quality.medium=description

Orta düzeyde arama kalitesi değeri verilen içerik alanları. Varsayılan değer boş bir dizedir.

Belirtilmemiş içerik alanları contentTemplate.csv.unmappedColumnsMode=IGNORE

Bağlantıcı, belirtilmemiş içerik alanlarını nasıl işler? Geçerli değerler şunlardır:

  • APPEND: Şablona belirtilmemiş içerik alanları ekleyin.
  • IGNORE: Belirtilmemiş içerik alanları yoksayılır.

    Varsayılan değer APPEND'dir.

8. Verileri incelemeyi planlama

Gezinme, bağlayıcının veri kaynağından (bu durumda bir CSV dosyası) içerik keşfetme işlemidir. CSV bağlayıcısı çalışırken CSV dosyasının satırlarını tarar ve her bir satırı dizine ekleme API'si aracılığıyla Cloud Search'e dizine ekler.

Tam tarama, dosyadaki tüm sütunları dizine ekler. Artımlı tarama yalnızca önceki taramadan bu yana eklenen veya değiştirilen sütunları dizine ekler. CSV bağlayıcısı yalnızca tam geçişler gerçekleştirir. Artımlı geçişler gerçekleştirmez.

Planlama parametreleri, bağlayıcının geçişler arasında ne sıklıkta beklediğini belirler. Yapılandırma dosyası planlama parametreleri içermiyorsa varsayılan değerler kullanılır. Bu parametreler aşağıdaki tabloda gösterilmektedir.

Yer Parametre
Bir aradan sonra tam tarama schedule.traversalIntervalSecs=7200

Bağlayıcı, belirtilen bir aradan sonra tam bir tarama gerçekleştirir. Geçişler arasındaki aralığı saniye cinsinden belirtin. Varsayılan değer 86400'dir (bir gündeki saniye sayısı).

Bağlayıcının başlatılması sırasında tam tarama schedule.performTraversalOnStart=false

Bağlayıcı, ilk aralığın sona ermesini beklemek yerine, bağlayıcı başlatılırken tam bir tarama gerçekleştirir. Varsayılan değer true (doğru) değeridir.

9. Erişim Kontrol Listesi (EKL) seçeneklerini belirtme

Google Cloud Search CSV bağlayıcısı, arama sonuçlarındaki CSV dosyasının içeriğine erişimi kontrol etmek için ACL'ler aracılığıyla izinleri destekler. Kullanıcıların dizine eklenen kayıtlara erişimini korumanıza olanak tanıyan birden fazla ACL seçeneği vardır.

Deponuzda her dokümanla ilişkili ayrı EKL bilgileri varsa Cloud Search'ta doküman erişimini kontrol etmek için tüm EKL bilgilerini yükleyin. Deponuzdan kısmi ACL bilgileri sağlanıyorsa veya hiç ACL bilgisi sağlanmıyorsa SDK'nın bağlayıcıya sağladığı aşağıdaki parametrelerde varsayılan ACL bilgilerini sağlayabilirsiniz.

Bağlayıcı, yapılandırma dosyasında varsayılan ACL'lerin etkinleştirilmesini kullanır. Varsayılan EKL'leri etkinleştirmek için defaultAcl.modenone dışında bir moda ayarlayın ve defaultAcl.* ile yapılandırın

Yer Parametre
EKL modu defaultAcl.mode=fallback

Zorunlu. CSV bağlayıcısı, varsayılan ACL işlevini kullanır. Bağlayıcı yalnızca yedek modu destekler.

Varsayılan EKL Adı defaultAcl.name=VIRTUAL_CONTAINER_FOR_CONNECTOR_1

İsteğe bağlı. Varsayılan ACL'leri ayarlamak için bağlayıcı tarafından kullanılan sanal kapsayıcı adını geçersiz kılmanıza olanak tanır. Varsayılan değer "DEFAULT_ACL_VIRTUAL_CONTAINER"dır. Birden fazla bağlayıcı aynı veri kaynağındaki içeriği dizine ekliyorsa bu değeri geçersiz kılabilirsiniz.

Varsayılan herkese açık EKL defaultAcl.public=true

Deponun tamamı için kullanılan varsayılan ACL, herkese açık alan erişimi olarak ayarlanmıştır. Varsayılan değer false.

Ortak ACL grup okuyucuları defaultAcl.readers.groups=google:group1, group2
Yaygın EKL okuyucuları defaultAcl.readers.users=user1, user2, google:user3
Ortak EKL, grup okuyucularına erişim izni vermedi defaultAcl.denied.groups=group3
Sık karşılaşılan ACL reddedilen okuyucular defaultAcl.denied.users=user4, user5
Alanın tamamına erişim Dizine eklenen her kaydın alan adındaki her kullanıcı tarafından herkese açık olarak erişilebilir olduğunu belirtmek için aşağıdaki seçeneklerin ikisini de değerlerle ayarlayın:
  • defaultAcl.mode=fallback
  • defaultAcl.public=true
Sık kullanılan EKL Veri deposunun her kaydı için bir ACL belirtmek üzere aşağıdaki parametre değerlerinin tümünü ayarlayın:
  • defaultAcl.mode=fallback
  • defaultAcl.public=false
  • defaultAcl.readers.groups=google:group1, group2
  • defaultAcl.readers.users=user1, user2, google:user3
  • defaultAcl.denied.groups=group3
  • defaultAcl.denied.users=user4, user5

    Belirtilen her kullanıcı ve grubun önüne "google:" (değişmez değer) eklenmediği sürece yerel alanda tanımlanmış bir kullanıcı/grup olduğu varsayılır.

    Varsayılan kullanıcı veya grup boş bir dizedir. Kullanıcı ve grup seçeneklerini yalnızca defaultAcl.public false olarak ayarlanmışsa sağlayın. Birden fazla grup ve kullanıcıyı listelemek için virgülle ayrılmış liste kullanın.

    defaultAcl.mode none olarak ayarlanırsa kayıtlar, tanımlanmış ayrı ACL'ler olmadan aranamaz.

Şema Tanımı

Cloud Search, yapılandırılmış ve yapılandırılmamış içeriğin dizine eklenmesine ve yayınlanmasına olanak tanır. Verilerinizde yapılandırılmış veri sorgularını desteklemek için veri kaynağınız için şemayı ayarlamanız gerekir.

CSV Bağlayıcı, tanımlandıktan sonra dizine ekleme istekleri oluşturmak için tanımlanmış şemaya başvurabilir. Açıklayıcı bir örnek vermek için filmlerle ilgili bilgiler içeren bir CSV dosyasını ele alalım.

Giriş CSV dosyasının aşağıdaki içeriğe sahip olduğunu varsayalım.

  1. movieId
  2. movieTitle
  3. açıklama
  4. yıl
  5. releaseDate
  6. oyuncular (virgülle (,) ayrılmış birden fazla değer)
  7. tür (birden çok değer)
  8. değerlendirmeler

Yukarıdaki veri yapısına göre, CSV dosyasından verileri dizine eklemek istediğiniz veri kaynağı için şemayı tanımlayabilirsiniz.

{
  "objectDefinitions": [
    {
      "name": "movie",
      "propertyDefinitions": [
        {
          "name": "actors",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "textPropertyOptions": {
            "operatorOptions": {
              "operatorName": "actor"
            }
          }
        },
        {
          "name": "releaseDate",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "datePropertyOptions": {
            "operatorOptions": {
              "operatorName": "released",
              "lessThanOperatorName": "releasedbefore",
              "greaterThanOperatorName": "releasedafter"
            }
          }
        },
        {
          "name": "movieTitle",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": "HIGHEST"
            },
            "operatorOptions": {
              "operatorName": "title"
            }
          }
        },
        {
          "name": "genre",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "enumPropertyOptions": {
            "operatorOptions": {
              "operatorName": "genre"
            },
            "possibleValues": [
              {
                "stringValue": "Action"
              },
              {
                "stringValue": "Documentary"
              },
              {
                "stringValue": "Drama"
              },
              {
                "stringValue": "Crime"
              },
              {
                "stringValue": "Sci-fi"
              }
            ]
          }
        },
        {
          "name": "userRating",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": true,
          "integerPropertyOptions": {
            "orderedRanking": "ASCENDING",
            "maximumValue": "10",
            "operatorOptions": {
              "operatorName": "score",
              "lessThanOperatorName": "scorebelow",
              "greaterThanOperatorName": "scoreabove"
            }
          }
        }
      ]
    }
  ]
}

Örnek yapılandırma dosyası

Aşağıdaki örnek yapılandırma dosyasında, örnek bir bağlayıcının davranışını tanımlayan key=value çiftleri gösterilmektedir.

# data source access
api.sourceId=1234567890abcd
api.serviceAccountPrivateKeyFile=./PrivateKey.json

# CSV data structure
csv.filePath=./movie_content.csv
csv.csvColumns=movieId,movieTitle,description,releaseYear,genre,actors,ratings,releaseDate
csv.skipHeaderRecord=true
url.format=https://mymoviesite.com/movies/{0}
url.columns=movieId
csv.datetimeFormat.releaseDate=yyyy-mm-dd
csv.multiValueColumns=genre,actors
csv.multiValue.genre=;
contentTemplate.csv.title=movieTitle

# metadata structured data and content
itemMetadata.title.field=movieTitle
itemMetadata.createTime.field=releaseDate
itemMetadata.contentLanguage.defaultValue=en-US
itemMetadata.objectType.defaultValue=movie
contentTemplate.csv.quality.medium=description
contentTemplate.csv.unmappedColumnsMode=IGNORE

#ACLs
defaultAcl.mode=fallback
defaultAcl.public=true

Her parametrenin ayrıntılı açıklamaları için Yapılandırma parametreleri referansına bakın.

Cloud Search CSV bağlayıcısını çalıştırma

Bağlantıyı komut satırından çalıştırmak için aşağıdaki komutu yazın:

$ java -jar google-cloudsearch-csv-connector-v1-0.0.3.jar -Dconfig=my.config

Bağlayıcı günlükleri varsayılan olarak standart çıkışta kullanılabilir. logging.properties değerini belirterek dosyalara günlük kaydı ekleyebilirsiniz.