ค้นหาชุดข้อมูลโดยตรง

หากต้องการเข้าถึงข้อมูลข้อมูลเชิงลึกเกี่ยวกับสถานที่โดยตรง คุณต้องเขียนคำค้นหา SQL ใน BigQuery ที่แสดงข้อมูลเชิงลึกแบบรวมเกี่ยวกับสถานที่ ระบบจะแสดงผลลัพธ์จาก ชุดข้อมูลสำหรับเกณฑ์การค้นหาที่ระบุในคำค้นหา

หากต้องการรับจำนวนที่น้อยกว่า 5 ให้ลองใช้ฟังก์ชัน Place count แทน ฟังก์ชันเหล่านี้สามารถแสดงผลจำนวนใดก็ได้ รวมถึง 0 แต่จะบังคับใช้พื้นที่ค้นหาขั้นต่ำ 40.0 x 40.0 เมตร (1600 ม.2) ดูข้อมูลเพิ่มเติมเกี่ยวกับกรณีที่ควรค้นหาโดยตรงและกรณีที่ควรใช้ฟังก์ชัน

ข้อมูลเบื้องต้นเกี่ยวกับการค้นหา

รูปภาพต่อไปนี้แสดงรูปแบบพื้นฐานของคำค้นหา

รูปแบบพื้นฐานของคำค้นหา

เราจะอธิบายแต่ละส่วนของคำค้นหาโดยละเอียดที่ด้านล่าง

ข้อกำหนดในการค้นหา

คำค้นหา SQL ที่สร้างในชุดข้อมูลโดยตรงต้องระบุชุดข้อมูลและรวม WITH AGGREGATION_THRESHOLD ในคําสั่ง SELECT หากไม่มีการระบุนี้ การค้นหาจะล้มเหลว

ตัวอย่างนี้ระบุ places_insights___us.places เพื่อค้นหาชุดข้อมูลสำหรับ สหรัฐอเมริกา

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`

ระบุชื่อโปรเจ็กต์ (ไม่บังคับ)

คุณจะใส่ชื่อโปรเจ็กต์ในการค้นหาก็ได้ หากคุณไม่ ระบุชื่อโปรเจ็กต์ คำค้นหาจะใช้โปรเจ็กต์ที่ใช้งานอยู่โดยค่าเริ่มต้น

คุณอาจต้องระบุชื่อโปรเจ็กต์หากลิงก์ชุดข้อมูลที่มีชื่อเดียวกันในโปรเจ็กต์ต่างๆ หรือหากกำลังค้นหาตารางภายนอกโปรเจ็กต์ที่ใช้งานอยู่

เช่น [project name].[dataset name].places

ระบุฟังก์ชันการรวมข้อมูล

ตัวอย่างด้านล่างแสดงฟังก์ชันการรวม BigQuery ที่รองรับ คําค้นหานี้จะรวบรวมคะแนนของสถานที่ทั้งหมดที่อยู่ภายในรัศมี 1,000 เมตร จากตึกเอ็มไพร์สเตตในนิวยอร์กซิตี้เพื่อสร้างสถิติคะแนน

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(id) AS place_count,
  APPROX_COUNT_DISTINCT(rating) as distinct_ratings,
  COUNTIF(rating > 4.0) as good_rating_count,
  LOGICAL_AND(rating <= 5) as all_ratings_equal_or_below_five,
  LOGICAL_OR(rating = 5) as any_rating_exactly_five,
  AVG(rating) as avg_rating,
  SUM(user_rating_count) as rating_count,
  COVAR_POP(rating, user_rating_count) as rating_covar_pop,
  COVAR_SAMP(rating, user_rating_count) as rating_covar_samp,
  STDDEV_POP(rating) as rating_stddev_pop,
  STDDEV_SAMP(rating) as rating_stddev_samp,
  VAR_POP(rating) as rating_var_pop,
  VAR_SAMP(rating) as rating_var_samp,
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)
  AND business_status = "OPERATIONAL"

ระบุการจำกัดสถานที่

หากคุณไม่ได้ระบุข้อจำกัดด้านสถานที่ ระบบจะใช้การรวบรวมข้อมูลกับชุดข้อมูลทั้งหมด โดยปกติแล้ว คุณจะระบุข้อจำกัดด้านสถานที่ตั้งเพื่อค้นหาใน พื้นที่ที่เฉพาะเจาะจง ตัวอย่างคำค้นหานี้ระบุข้อจำกัดเป้าหมายที่อยู่ตรงกลาง ตึกเอ็มไพร์สเตตในนิวยอร์กซิตี้ โดยมีรัศมี 1, 000 เมตร

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)

คุณใช้รูปหลายเหลี่ยมเพื่อระบุพื้นที่ค้นหาได้ เมื่อใช้รูปหลายเหลี่ยม จุดของรูปหลายเหลี่ยมต้องกำหนดลูปปิด โดยจุดแรกในรูปหลายเหลี่ยมต้องเป็นจุดเดียวกับจุดสุดท้าย

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_CONTAINS(ST_GEOGFROMTEXT("""POLYGON((-73.985708 40.75773,-73.993324 40.750298,
                                      -73.9857 40.7484,-73.9785 40.7575,
                                      -73.985708 40.75773))"""), point)

ในตัวอย่างถัดไป คุณจะกำหนดพื้นที่ค้นหาโดยใช้เส้นของจุดที่เชื่อมต่อกัน และตั้งค่ารัศมีการค้นหาเป็น 100 เมตรรอบเส้น เส้นทางนี้คล้ายกับ เส้นทางการเดินทางที่คำนวณโดย Routes API เส้นทางอาจเป็นเส้นทางสำหรับยานพาหนะ จักรยาน หรือคนเดินเท้า

DECLARE route GEOGRAPHY;

SET route = ST_GEOGFROMTEXT("""LINESTRING(-73.98903537033028 40.73655649223003,
                                          -73.93580216278471 40.80955538843361)""");

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
  ST_DWITHIN(route, point, 100)

กรองตามช่องชุดข้อมูลสถานที่

ปรับแต่งการค้นหาตามช่องที่กำหนดโดยสคีมา ชุดข้อมูล กรองผลลัพธ์ตามฟิลด์ชุดข้อมูล เช่น สถานที่ regular_opening_hours, price_level และ ลูกค้า rating

อ้างอิงฟิลด์ใดก็ได้ในชุดข้อมูลที่กำหนดโดยสคีมาชุดข้อมูลสำหรับประเทศที่คุณสนใจ สคีมาชุดข้อมูลของแต่ละประเทศประกอบด้วย 2 ส่วน ดังนี้

เช่น การค้นหาของคุณอาจมีวลี WHERE ที่กำหนดเกณฑ์การกรอง สำหรับการค้นหา

ในตัวอย่างต่อไปนี้ คุณจะแสดงข้อมูลการรวบรวม สำหรับสถานที่ประเภท tourist_attraction ที่มี business_status เป็น OPERATIONAL ซึ่งมี rating มากกว่าหรือเท่ากับ 4.0 และมี allows_dogs ตั้งค่าเป็น true

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)
AND 'tourist_attraction' IN UNNEST(types)
AND business_status = "OPERATIONAL"
AND rating >= 4.0
AND allows_dogs = true

การค้นหาถัดไปจะแสดงผลลัพธ์สำหรับสถานที่ที่มีสถานีชาร์จ EV อย่างน้อย 8 แห่ง

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ev_charge_options.connector_count > 8;

กรองตามประเภทหลักของสถานที่และประเภทสถานที่

สถานที่แต่ละแห่งในชุดข้อมูลมีได้ดังนี้

  • ประเภทหลักเดียวที่เชื่อมโยงกับประเภทที่กำหนดโดยประเภทสถานที่ ตัวอย่างเช่น ประเภทหลักอาจเป็น mexican_restaurant หรือ steak_house ใช้ primary_type ในการค้นหาเพื่อกรองผลลัพธ์ตามประเภทหลักของสถานที่

  • ค่าประเภทหลายค่าที่เชื่อมโยงกับค่าดังกล่าวจากประเภทที่กำหนดโดย ประเภทสถานที่ เช่น ร้านอาหารอาจมีประเภทต่อไปนี้ seafood_restaurant, restaurant, food, point_of_interest, establishment ใช้ types ในคำค้นหาเพื่อกรองผลลัพธ์ในรายการประเภทที่เชื่อมโยงกับสถานที่

การค้นหาต่อไปนี้จะแสดงผลลัพธ์สำหรับสถานที่ทั้งหมดที่มีประเภทหลักเป็น skin_care_clinic ซึ่งทำหน้าที่เป็นspa ด้วย

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  'spa' IN UNNEST(types)
  AND 'skin_care_clinic' = primary_type

กรองตามรหัสสถานที่

ตัวอย่างด้านล่างจะคำนวณคะแนนเฉลี่ยของสถานที่ 5 แห่ง สถานที่ต่างๆ จะระบุด้วยplace_id

DECLARE place_ids ARRAY<STRING>;
SET place_ids = ['ChIJPQOh8YVZwokRE2WsbZI4tOk', 'ChIJibtT3ohZwokR7tX0gp0nG8U',
                 'ChIJdfD8moVZwokRO6vxjXAtoWs', 'ChIJsdNONuFbwokRLM-yuifjb8k',
                 'ChIJp0gKoClawokR0txqrcaEkFc'];
SELECT WITH AGGREGATION_THRESHOLD
 AVG(rating) as avg_rating,
FROM
  `PROJECT_NAME.places_insights___us.places`,
  UNNEST(place_ids) place_id
WHERE
  id = place_id;

กรองรหัสสถานที่บางรายการออก

นอกจากนี้ คุณยังยกเว้นอาร์เรย์ของ Place IDs จากการค้นหาได้ด้วย

คุณค้นหารหัสสถานที่ที่ต้องการได้โดยใช้เครื่องมือค้นหารหัสสถานที่ หรือ โดยใช้โปรแกรมใช้ Places API เพื่อส่งคำขอ Text Search (ใหม่)

ในตัวอย่างด้านล่างนี้ คำค้นหาจะนับจำนวนคาเฟ่ในรหัสไปรษณีย์ 2000 ของซิดนีย์ ออสเตรเลีย ซึ่งไม่ปรากฏในอาร์เรย์ excluded_cafes คำค้นหาดังกล่าวอาจมีประโยชน์สำหรับเจ้าของธุรกิจที่ต้องการยกเว้นธุรกิจของตนเองจากการนับ

WITH excluded_cafes AS (
  -- List the specific place IDs to exclude from the final count
  SELECT * FROM UNNEST([
    'ChIJLTcYGz-uEmsRmazk9oMnP5w', 'ChIJeWDDDNOvEmsRF8SMPUwPbhw',
    'ChIJKdaKHbmvEmsRSdxq_1O05bU'
  ]) AS place_id
)

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `places_insights___au.places` AS places
-- Perform a LEFT JOIN to identify which places are in the exclusion list
LEFT JOIN
  excluded_cafes ON places.id = excluded_cafes.place_id
WHERE
  -- Filter for specific place type and postal code
  places.primary_type = 'cafe'
  AND '2000' IN UNNEST(places.postal_code_names)
  -- Keep only the rows where the join failed (meaning the ID was NOT in the list)
  AND excluded_cafes.place_id IS NULL;

กรองตามค่าข้อมูลที่กำหนดไว้ล่วงหน้า

ฟิลด์ชุดข้อมูลหลายรายการมีค่าที่กำหนดไว้ล่วงหน้า เช่น

  • ฟิลด์ price_level รองรับค่าที่กำหนดไว้ล่วงหน้าต่อไปนี้

    • PRICE_LEVEL_FREE
    • PRICE_LEVEL_INEXPENSIVE
    • PRICE_LEVEL_MODERATE
    • PRICE_LEVEL_EXPENSIVE
    • PRICE_LEVEL_VERY_EXPENSIVE
  • ฟิลด์ business_status รองรับค่าที่กำหนดไว้ล่วงหน้าต่อไปนี้

    • OPERATIONAL
    • CLOSED_TEMPORARILY
    • CLOSED_PERMANENTLY

ในตัวอย่างนี้ คำค้นหาจะแสดงผลจำนวนร้านดอกไม้ทั้งหมดที่มีbusiness_statusเป็น OPERATIONAL ภายในรัศมี 1, 000 เมตรจากเอ็มไพร์สเตต บิลดิงในนิวยอร์กซิตี้

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)
AND business_status = "OPERATIONAL"
AND 'florist' IN UNNEST(types)

กรองตามเวลาทำการ

ในตัวอย่างนี้ ให้แสดงจำนวนสถานที่ทั้งหมดในพื้นที่ทางภูมิศาสตร์ที่มีช่วงเวลา แฮปปี้อาวร์ในวันศุกร์

SELECT WITH AGGREGATION_THRESHOLD COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`,
UNNEST(regular_opening_hours_happy_hour.friday) AS friday_hours
WHERE '17:00:00' BETWEEN friday_hours.start_time AND friday_hours.end_time
AND ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000);

กรองตามภูมิภาค (คอมโพเนนต์ที่อยู่)

ชุดข้อมูลสถานที่ของเรายังมีชุดคอมโพเนนต์ที่อยู่ซึ่งมีประโยชน์สำหรับ การกรองผลลัพธ์ตามขอบเขตทางการเมือง คอมโพเนนต์ที่อยู่แต่ละรายการจะ ระบุด้วยชื่อรหัสข้อความ (10002 สำหรับรหัสไปรษณีย์ในนิวยอร์ก) หรือรหัสสถานที่ (ChIJm5NfgIBZwokR6jLqucW0ipg) สำหรับรหัสไปรษณีย์ที่เทียบเท่า

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  '10002' IN UNNEST(postal_code_names)
  --- 'ChIJm5NfgIBZwokR6jLqucW0ipg'  IN UNNEST(postal_code_ids) -- same filter as above using postal code ID

กรองตามการชาร์จ EV

ตัวอย่างนี้แสดงจำนวนสถานที่ที่มีเครื่องชาร์จ EV อย่างน้อย 8 เครื่อง

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ev_charge_options.connector_count > 8;

ตัวอย่างนี้จะนับจำนวนสถานที่ที่มีเครื่องชาร์จ Tesla อย่างน้อย 10 เครื่อง ที่รองรับการชาร์จเร็ว

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`, UNNEST(ev_charge_options.connector_aggregation) as connectors
WHERE
  connectors.type ='EV_CONNECTOR_TYPE_TESLA'
  AND connectors.max_charge_rate_kw >= 50
  AND connectors.count >= 10

ส่งคืนกลุ่มผลลัพธ์

คําค้นหาที่แสดงจนถึงตอนนี้จะแสดงผลแถวเดียวในผลลัพธ์ที่มี จํานวนการรวมสําหรับคําค้นหา นอกจากนี้ คุณยังใช้ตัวดำเนินการ GROUP BY เพื่อ แสดงผลหลายแถวในการตอบกลับตามเกณฑ์การจัดกลุ่มได้ด้วย

ตัวอย่างเช่น การค้นหาต่อไปนี้จะแสดงผลลัพธ์ที่จัดกลุ่มตามประเภทหลักของ สถานที่แต่ละแห่งในพื้นที่ค้นหา

SELECT WITH AGGREGATION_THRESHOLD
  primary_type,
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ST_DWITHIN(ST_GEOGPOINT(-73.99992071622756, 40.71818785986936), point, 1000)
GROUP BY primary_type

รูปภาพนี้แสดงตัวอย่างเอาต์พุตของคำค้นหานี้

ผลการค้นหาของคำค้นหาสำหรับการจัดกลุ่มผลลัพธ์ตามประเภทหลัก

ในตัวอย่างนี้ คุณจะกำหนดตารางสถานที่ตั้ง จากนั้นสำหรับแต่ละสถานที่ตั้ง ให้ คำนวณจำนวนร้านอาหารที่อยู่ใกล้เคียง ซึ่งหมายถึงร้านอาหารที่อยู่ภายใน 1, 000 เมตร

WITH my_locations AS (
  SELECT 'Location 1' AS name, ST_GEOGPOINT(-74.00776440888504, 40.70932825380786) AS location
  UNION ALL
  SELECT 'Location 2' AS name, ST_GEOGPOINT(-73.98257192833559, 40.750738934863215) AS location
  UNION ALL
  SELECT 'Location 3' AS name, ST_GEOGPOINT(-73.94701794263223, 40.80792954838445)  AS location
)
SELECT WITH AGGREGATION_THRESHOLD
  l.name,
  COUNT(*) as count
FROM
  `PROJECT_NAME.places_insights___us.places`
JOIN
   my_locations l
ON
  ST_DWITHIN(l.location, p.point, 1000)
WHERE
  primary_type = "restaurant"
  AND business_status = "OPERATIONAL"
GROUP BY
  l.name

รูปภาพนี้แสดงตัวอย่างเอาต์พุตของคำค้นหานี้

ผลการค้นหาสำหรับจัดกลุ่มผลลัพธ์ตามสถานที่ตั้ง