Bắt đầu

Khi làm việc với đầu mối liên hệ về bán hàng hoặc hỗ trợ để thiết lập quyền truy cập vào Data Transfer v2.0, bạn sẽ được cung cấp tên nhóm. Bạn sẽ cần cung cấp cho người liên hệ bán hàng của mình một Nhóm Google để bạn có thể kiểm soát quyền truy cập vào tệp dữ liệu của mình trong Google Cloud Storage.

Bạn có thể chọn truy cập vào dữ liệu của mình bằng tiện ích hoặc bạn có thể tự viết mã.

Truy cập dữ liệu bằng gsutil

Công cụ gsutil là một ứng dụng dòng lệnh được viết bằng Python, cho phép bạn truy cập vào dữ liệu mà không cần phải lập trình. Ví dụ: bạn có thể dùng gsutil trong một tập lệnh hoặc tệp hàng loạt thay vì tạo các ứng dụng tuỳ chỉnh.

Để bắt đầu sử dụng gsutil, hãy đọc tài liệu gsutil. Công cụ này sẽ nhắc bạn cung cấp thông tin đăng nhập vào lần đầu tiên bạn sử dụng và sau đó lưu trữ thông tin đó để sử dụng sau này.

Ví dụ về gsutil

Bạn có thể liệt kê tất cả tệp bằng gsutil như sau:

gsutil ls gs://[bucket_name]/[object name/file name]

gsutil sử dụng nhiều cú pháp giống như UNIX, bao gồm cả dấu hoa thị (*) đại diện. Vì vậy, bạn có thể liệt kê tất cả các tệp NetworkImpression:

gsutil ls gs://[bucket_name]/dcm_account6837_impression_*

Bạn cũng có thể dễ dàng tải tệp xuống:

gsutil cp gs://[bucket_name]/dcm_account6837_impression_2015120100.log.gz

Bạn có thể sao chép các tệp từ các vùng lưu trữ DT Google phân tán vào vùng lưu trữ GCS Google API của riêng bạn bằng cách sử dụng một tập lệnh shell Unix. Có 2 lựa chọn:

  • Trong gsutil, nếu bạn đang sử dụng Hệ thống Unix, hãy chạy lệnh sau cho tất cả các vùng chứa của bạn hằng ngày:

    $ day=$(date --date="1 days ago" +"%m-%d-%Y")
    $ gsutil -m cp gs://{<dcmhashid_A>,<dcmhashid_B>,etc.}/*$day*.log.gz gs://<client_bucket>/
  • Ngoài ra, một giải pháp phức tạp hơn một chút là sử dụng tệp bash:

    #!/bin/bash
    
    set -x
    
    buckets={dfa_-hasid_A dfa_-hashid_B,...} #include all hash ids
    day=$(date --date="1 days ago" +"%m-%d-%Y")
    for b in ${buckets[@]}; do /
        gsutil -m cp gs://$b/*$day*.log.gz gs:/// /
    done

Truy cập vào dữ liệu theo phương thức lập trình

Google Cloud Storage có các API và mẫu cho nhiều ngôn ngữ lập trình, giúp bạn truy cập vào dữ liệu theo cách lập trình. Dưới đây là các bước dành riêng cho Data Transfer v2.0 mà bạn phải thực hiện để tạo một mối tích hợp hoạt động.

Tạo một tài khoản dịch vụ

Để bắt đầu sử dụng Data Transfer v2.0, trước tiên bạn cần sử dụng công cụ thiết lập. Công cụ này sẽ hướng dẫn bạn quy trình tạo dự án trong Google API Console và bật API.

Để thiết lập một tài khoản dịch vụ mới, hãy làm như sau:

  1. Nhấp vào Tạo thông tin xác thực > Khoá tài khoản dịch vụ.
  2. Chọn tải khoá công khai/khoá riêng tư của tài khoản dịch vụ xuống dưới dạng tệp P12 tiêu chuẩn hoặc dưới dạng tệp JSON mà thư viện ứng dụng API của Google có thể tải.

Cặp khóa công khai/riêng tư mới của bạn sẽ được tạo và tải xuống máy của bạn; đây là bản sao duy nhất của khóa này. Bạn có trách nhiệm lưu trữ cặp khoá một cách an toàn.

Hãy nhớ giữ cửa sổ này ở trạng thái mở, bạn sẽ cần địa chỉ email của tài khoản dịch vụ ở bước tiếp theo.

Thêm tài khoản dịch vụ vào nhóm

  • Truy cập vào Google Group
  • Nhấp vào Nhóm của tôi rồi chọn nhóm mà bạn dùng để quản lý quyền truy cập vào Bộ chứa Cloud Storage DT phiên bản 2.0
  • Nhấp vào Quản lý
  • Đừng nhấp vào Mời thành viên!
  • Nhấp vào Trực tiếp thêm thành viên
  • Sao chép email tài khoản dịch vụ từ bước trước vào hộp thành viên
  • Chọn Không có email
  • Nhấp vào nút Thêm

Tôi vô tình nhấp vào nút Mời thành viên

Phạm vi

Mọi phạm vi được truyền đến Cloud Storage đều phải là Chỉ đọc

Ví dụ: khi sử dụng thư viện ứng dụng Java, phạm vi chính xác cần sử dụng là:

StorageScopes.DEVSTORAGE_READ_ONLY