Mala direta com a API Docs

Este guia explica como usar a API Google Docs para fazer uma mala direta.

Introdução

Uma mala direta usa valores de linhas de uma planilha ou de outra fonte de dados e insere em um documento modelo. Assim, você pode criar uma instância documento (o modelo) a partir do qual é possível gerar muitos documentos semelhantes, cada personalizado com os dados que estão sendo mesclados. O resultado não é necessariamente usado para correspondência ou cartas de formulário, mas podem ser para qualquer finalidade, como gerar um lote de faturas de clientes.

A mala direta existe desde que havia planilhas e palavras processadores e faz parte de muitos fluxos de trabalho empresariais hoje. A convenção é organizar os dados como um registro por linha, com as colunas representando os campos em os dados, conforme mostrado na tabela a seguir:

Nome Endereço Zona
1 UrbanPq Avenida Brasil, 123 Oeste
2 Pawxana Avenida Brasil, 123 Sul

O app de exemplo nesta página mostra como usar os recursos do Documentos Google, Planilhas e Drive para abstrair detalhes de como malas diretas são realizadas, protegendo usuários contra implementações problemas. Para mais informações sobre esse exemplo em Python, acesse o repositório do GitHub.

Exemplo de aplicativo

Este aplicativo de exemplo copia seu modelo principal e mescla as variáveis do seu em cada uma das cópias. Para testar este app de exemplo, primeiro configurar seu modelo:

  1. Crie um arquivo dos Documentos Google. Escolha o que você quer usar.
  2. Anote o ID do documento do novo arquivo. Para mais informações, consulte ID do documento.
  3. Defina a variável DOCS_FILE_ID como o ID do documento.
  4. Substitua os dados de contato por variáveis de marcador de posição do modelo que o com os dados selecionados.

Este é um exemplo de carta modelo com espaços reservados que podem ser mesclados com dados reais de uma fonte, como texto texto ou Planilhas. Veja como é esse modelo:

Em seguida, escolha o texto simples ou as Planilhas como sua fonte de dados. usando a variável SOURCE. A amostra usa texto simples como padrão, ou seja, os dados de amostra usam a variável TEXT_SOURCE_DATA. Para extrair dados de Planilhas, atualize a variável SOURCE para 'sheets' e aponte-a para nossa planilha de amostra (ou a sua própria) definindo a variável SHEETS_FILE_ID.

Para você conferir o formato da planilha, veja como ela é:

Teste o app com nossos dados de amostra e depois adapte-o aos seus dados e caso de uso. O aplicativo de linha de comando funciona assim:

  • Configuração
  • buscar os dados na fonte de dados.
  • Repetir cada linha de dados
    • Criar uma cópia do modelo
    • Mesclar a cópia com os dados
    • Link de saída para o documento recém-mesclado

Todas as letras mescladas recentemente também vão aparecer no Meu Drive do usuário. Um exemplo de uma letra mesclada é mais ou menos assim:

Código-fonte

Python

docs/mail-merge/docs_mail_merge.py
import time

import google.auth
from googleapiclient.discovery import build
from googleapiclient.errors import HttpError

# Fill-in IDs of your Docs template & any Sheets data source
DOCS_FILE_ID = "195j9eDD3ccgjQRttHhJPymLJUCOUjs-jmwTrekvdjFE"
SHEETS_FILE_ID = "11pPEzi1vCMNbdpqaQx4N43rKmxvZlgEHE9GqpYoEsWw"

# authorization constants

SCOPES = (  # iterable or space-delimited string
    "https://www.googleapis.com/auth/drive",
    "https://www.googleapis.com/auth/documents",
    "https://www.googleapis.com/auth/spreadsheets.readonly",
)

# application constants
SOURCES = ("text", "sheets")
SOURCE = "text"  # Choose one of the data SOURCES
COLUMNS = ["to_name", "to_title", "to_company", "to_address"]
TEXT_SOURCE_DATA = (
    (
        "Ms. Lara Brown",
        "Googler",
        "Google NYC",
        "111 8th Ave\nNew York, NY  10011-5201",
    ),
    (
        "Mr. Jeff Erson",
        "Googler",
        "Google NYC",
        "76 9th Ave\nNew York, NY  10011-4962",
    ),
)

# fill-in your data to merge into document template variables
merge = {
    # sender data
    "my_name": "Ayme A. Coder",
    "my_address": "1600 Amphitheatre Pkwy\nMountain View, CA  94043-1351",
    "my_email": "http://google.com",
    "my_phone": "+1-650-253-0000",
    # - - - - - - - - - - - - - - - - - - - - - - - - - -
    # recipient data (supplied by 'text' or 'sheets' data source)
    "to_name": None,
    "to_title": None,
    "to_company": None,
    "to_address": None,
    # - - - - - - - - - - - - - - - - - - - - - - - - - -
    "date": time.strftime("%Y %B %d"),
    # - - - - - - - - - - - - - - - - - - - - - - - - - -
    "body": (
        "Google, headquartered in Mountain View, unveiled the new "
        "Android phone at the Consumer Electronics Show. CEO Sundar "
        "Pichai said in his keynote that users love their new phones."
    ),
}

creds, _ = google.auth.default()
# pylint: disable=maybe-no-member

# service endpoints to Google APIs

DRIVE = build("drive", "v2", credentials=creds)
DOCS = build("docs", "v1", credentials=creds)
SHEETS = build("sheets", "v4", credentials=creds)


def get_data(source):
  """Gets mail merge data from chosen data source."""
  try:
    if source not in {"sheets", "text"}:
      raise ValueError(
          f"ERROR: unsupported source {source}; choose from {SOURCES}"
      )
    return SAFE_DISPATCH[source]()
  except HttpError as error:
    print(f"An error occurred: {error}")
    return error


def _get_text_data():
  """(private) Returns plain text data; can alter to read from CSV file."""
  return TEXT_SOURCE_DATA


def _get_sheets_data(service=SHEETS):
  """(private) Returns data from Google Sheets source. It gets all rows of
  'Sheet1' (the default Sheet in a new spreadsheet), but drops the first
  (header) row. Use any desired data range (in standard A1 notation).
  """
  return (
      service.spreadsheets()
      .values()
      .get(spreadsheetId=SHEETS_FILE_ID, range="Sheet1")
      .execute()
      .get("values")[1:]
  )
  # skip header row


# data source dispatch table [better alternative vs. eval()]
SAFE_DISPATCH = {k: globals().get(f"_get_{k}_data") for k in SOURCES}


def _copy_template(tmpl_id, source, service):
  """(private) Copies letter template document using Drive API then
  returns file ID of (new) copy.
  """
  try:
    body = {"name": f"Merged form letter ({source})"}
    return (
        service.files()
        .copy(body=body, fileId=tmpl_id, fields="id")
        .execute()
        .get("id")
    )
  except HttpError as error:
    print(f"An error occurred: {error}")
    return error


def merge_template(tmpl_id, source, service):
  """Copies template document and merges data into newly-minted copy then
  returns its file ID.
  """
  try:
    # copy template and set context data struct for merging template values
    copy_id = _copy_template(tmpl_id, source, service)
    context = merge.iteritems() if hasattr({}, "iteritems") else merge.items()

    # "search & replace" API requests for mail merge substitutions
    reqs = [
        {
            "replaceAllText": {
                "containsText": {
                    "text": "{{%s}}" % key.upper(),  # {{VARS}} are uppercase
                    "matchCase": True,
                },
                "replaceText": value,
            }
        }
        for key, value in context
    ]

    # send requests to Docs API to do actual merge
    DOCS.documents().batchUpdate(
        body={"requests": reqs}, documentId=copy_id, fields=""
    ).execute()
    return copy_id
  except HttpError as error:
    print(f"An error occurred: {error}")
    return error


if __name__ == "__main__":
  # get row data, then loop through & process each form letter
  data = get_data(SOURCE)  # get data from data source
  for i, row in enumerate(data):
    merge.update(dict(zip(COLUMNS, row)))
    print(
        "Merged letter %d: docs.google.com/document/d/%s/edit"
        % (i + 1, merge_template(DOCS_FILE_ID, SOURCE, DRIVE))
    )

Para mais informações, consulte o arquivo README e o código-fonte completo do aplicativo no GitHub do aplicativo de exemplo repositório.