인벤토리에 따라 샤딩 (또는 피드를 여러 파일로 분할)이 필요할 수 있습니다.
샤딩을 사용해야 하는 경우
피드가 1파일당 200MB를 초과합니다 (gzip 압축 후).
- 예: 생성된 어베일러빌리티 피드는 1GB입니다. 5개 이상의 별도 파일 (또는 샤드)로 샤딩해야 합니다.
파트너 인벤토리가 시스템 또는 지역에 분산되어 인벤토리를 조정하기 어렵습니다.
- 예: 파트너에게 별도의 시스템에 있는 미국 및 EU 인벤토리가 있습니다. 피드는 2개의 파일 (또는 샤드)로 생성될 수 있으며, 하나는 미국용, 하나는 EU용으로 동일한
nonce및generation_timestamp를 사용합니다.
- 예: 파트너에게 별도의 시스템에 있는 미국 및 EU 인벤토리가 있습니다. 피드는 2개의 파일 (또는 샤드)로 생성될 수 있으며, 하나는 미국용, 하나는 EU용으로 동일한
일반 규칙
- 각 샤드는 파일당 200MB를 초과할 수 없습니다 (gzip 압축 후).
- 피드당 샤드는 20개 이하로 사용하는 것이 좋습니다. 이 금액을 초과하는 비즈니스 사유가 있는 경우 지원팀에 문의하여 추가 안내를 받으세요.
-
개별 레코드 (예: 하나의
Merchant객체)는 하나의 샤드로 전송해야 하며 여러 샤드로 분할할 수 없습니다. 그러나 이후 피드에서 동일한shard_number를 사용하여 샤드로 전송하지 않아도 됩니다. - 성능을 향상하려면 데이터를 샤드 간에 균등하게 분할하여 모든 샤드 파일의 크기를 비슷하게 만듭니다.
피드를 샤딩하는 방법
각 파일 (또는 샤드)에 대해 FeedMetadata를 다음으로 설정합니다.
processing_instruction가PROCESS_AS_COMPLETE로 설정됩니다.shard_number: 피드의 현재 샤드로 설정됩니다(단절 없이 0부터total_shards- 1까지).total_shards: 피드의 총 샤드 수 (1부터 시작)로 설정nonce는 동일한 피드의 모든 샤드에서 동일하지만 다른 피드의 값과는 다른 고유 식별자로 설정됩니다.nonce는 양수 정수 (uint64)여야 합니다.generation_timestamp은 Unix 및 EPOCH 형식의 타임스탬프입니다. 이는 피드의 모든 샤드에서 동일해야 합니다.
권장: 각 파일 (또는 샤드)의 경우 피드 유형, 타임스탬프, 샤드 번호, 총 샤드 수를 나타내도록 파일 이름을 설정합니다. 샤드의 크기는 거의 같아야 하며 모든 샤드가 업로드되면 처리됩니다.
Example:“availability_feed_1574117613_001_of_002.json.gz”
샤딩된 이용 가능 여부 피드 예시
샤드 0
{
"metadata": {
"processing_instruction": "PROCESS_AS_COMPLETE",
"shard_number": 0,
"total_shards": 3,
"nonce": 111111,
"generation_timestamp": 1524606581
},
"service_availability": [
{
"availability": [
{
"spots_total": 1,
"spots_open": 1,
"duration_sec": 3600,
"service_id": "1000",
"start_sec": 1577275200,
"merchant_id": "merchant1",
"confirmation_mode": "CONFIRMATION_MODE_SYNCHRONOUS"
}
]
}
]
}샤드 1
{
"metadata": {
"processing_instruction": "PROCESS_AS_COMPLETE",
"shard_number": 1,
"total_shards": 3,
"nonce": 111111,
"generation_timestamp": 1524606581
},
"service_availability": [
{
"availability": [
{
"spots_total": 1,
"spots_open": 1,
"duration_sec": 3600,
"service_id": "1000",
"start_sec": 1577620800,
"merchant_id": "merchant2",
"confirmation_mode": "CONFIRMATION_MODE_SYNCHRONOUS"
}
]
}
]
}샤드 2
{
"metadata": {
"processing_instruction": "PROCESS_AS_COMPLETE",
"shard_number": 2,
"total_shards": 3,
"nonce": 111111,
"generation_timestamp": 1524606581
},
"service_availability": [
{
"availability": [
{
"spots_total": 1,
"spots_open": 1,
"duration_sec": 3600,
"service_id": "1000",
"start_sec": 1576670400,
"merchant_id": "merchant3",
"confirmation_mode": "CONFIRMATION_MODE_SYNCHRONOUS"
}
]
}
]
}파트너 분산 인벤토리에 샤딩 사용
파트너가 여러 시스템 또는 지역으로 분산된 인벤토리를 단일 피드로 통합하는 것은 쉽지 않을 수 있습니다. 샤딩은 각 샤드를 각 분산 시스템의 인벤토리 세트에 맞게 설정하여 조정 문제를 해결하는 데 사용할 수 있습니다.
예를 들어 파트너의 인벤토리가 두 개의 시스템에 있는 두 지역 (미국 및 EU 인벤토리)으로 분할되었다고 가정해 보겠습니다.
파트너는 각 피드를 2개의 파일 (또는 샤드)로 분할할 수 있습니다.
- 판매자 피드: 미국 1개 샤드, EU 1개 샤드
- 서비스 피드: 미국 샤드 1개, EU 샤드 1개
- 이용 가능 여부 피드: 미국 샤드 1개, EU 샤드 1개
피드가 제대로 처리되는지 확인하려면 다음 단계를 따르세요.
- 업로드 일정을 결정하고 일정에 따라 인벤토리의 각 인스턴스를 구성합니다.
- 각 인스턴스에 고유한 샤드 번호를 할당합니다 (예: 미국 = N, EU = N + 1).
total_shards를 총 샤드 수로 설정합니다. - 예약된 업로드 시간마다
generation_timestamp및nonce를 결정합니다.FeedMetadata에서 모든 인스턴스가 이 두 필드의 값을 동일하게 유지하도록 설정합니다.generation_timestamp은 현재 또는 최근 과거여야 합니다(가급적 파트너의 데이터베이스 읽기 타임스탬프).
- 모든 샤드가 업로드되면 Google은
generation_timestamp및nonce를 통해 샤드를 그룹화합니다.
각 샤드가 파트너 인벤토리의 서로 다른 지역을 나타내고 generation_timestamp가 모든 샤드에서 동일하다면 Google은 피드를 하나로 처리합니다. 다만 피드가 하루 중 서로 다른 시간에 업로드될 수 있습니다.
지역별로 샤딩된 어베일러빌리티 피드 예
샤드 0 - 미국 인벤토리
{
"metadata": {
"processing_instruction": "PROCESS_AS_COMPLETE",
"shard_number": 0,
"total_shards": 2,
"nonce": 111111,
"generation_timestamp": 1524606581
},
"service_availability": [
{
"availability": [
{
"spots_total": 1,
"spots_open": 1,
"duration_sec": 3600,
"service_id": "1000",
"start_sec": 1577275200,
"merchant_id": "US_merchant_1",
"confirmation_mode": "CONFIRMATION_MODE_SYNCHRONOUS"
}
]
}
]
}샤드 1 - EU 인벤토리
{
"metadata": {
"processing_instruction": "PROCESS_AS_COMPLETE",
"shard_number": 1,
"total_shards": 2,
"nonce": 111111,
"generation_timestamp": 1524606581
},
"service_availability": [
{
"availability": [
{
"spots_total": 1,
"spots_open": 1,
"duration_sec": 3600,
"service_id": "1000",
"start_sec": 1577620800,
"merchant_id": "EU_merchant_1",
"confirmation_mode": "CONFIRMATION_MODE_SYNCHRONOUS"
}
]
}
]
}