Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Questa pagina fornisce i requisiti di base per i codec video del client dell'API Google Meet Media per garantire una buona esperienza utente.
Requisiti funzionali
Questa sezione specifica i requisiti per i tipi e le funzionalità di codec.
Funzionalità
Requisito
Profilo
AV1
VP9
VP8
Main
Profile 0
N/D
Scalabilità
Il decoder deve supportare la scalabilità temporale, la scalabilità spaziale o entrambe, se richiesto dalle
specifiche di codifica per un determinato tipo e profilo di codec.
Formato video grezzo
Il codec deve essere in grado di elaborare risoluzioni dispari (ad esempio quando la larghezza o l'altezza del frame non sono
multipli di 2; ad esempio, 133 × 141). Per i formati di crominanza con sottocampionamento, il numero di campioni di crominanza per dimensione deve essere arrotondato per eccesso quando viene derivato dal numero di campioni di luminanza.
Non sono consentiti ritagli, padding o ridimensionamenti. La risoluzione del frame di output deve corrispondere
alla risoluzione del frame di input.
Requisiti operativi
Questa sezione specifica i requisiti per le varie condizioni in cui è previsto il funzionamento del codec video. La violazione di questi requisiti potrebbe limitare l'utilizzo
del codec a un sottoinsieme di scenari, ma non ne impedisce necessariamente l'utilizzo. Ad esempio, se il numero massimo di istanze del codec è inferiore
a quello richiesto, il codec può comunque essere utilizzato insieme a codec di altri tipi o
implementazioni.
Parametro
Requisito
Risoluzione minima, pixel
≤ 128 × 128
Risoluzione massima, pixel
≥ 2880 × 1800
Frequenza frame minima, FPS
≤ 1
Frequenza fotogrammi massima, FPS
≥ 30
Velocità in bit minima, kbps
≤ 30
Velocità in bit massima, kbps
≥ 5000
Numero massimo di istanze del decodificatore
≥ 3
Throughput di decodifica totale massimo, pixel al secondo
≥ 3 × 2880 × 1880 × 30
Requisiti di rendimento
Questa sezione specifica i requisiti relativi alle prestazioni del codec. La violazione di questi
requisiti può influire notevolmente sull'esperienza utente e bloccherà quasi
sicuramente l'utilizzo del codec.
Parametro
Requisito
Tempo di elaborazione interframe massimo, secondi
≤ 1 / max(30, encode_target_frame_rate_fps)
Tempo massimo di elaborazione dei fotogrammi chiave, secondi
≤ 2 / max(30, encode_target_frame_rate_fps)
Il tempo di elaborazione del frame è la differenza di tempo tra due eventi: 1) il codec
fornisce il frame e 2) il codec riceve il frame. Il tempo medio di elaborazione dei frame viene calcolato su una finestra mobile di almeno 10 secondi di durata contenente almeno 10 frame. Il tempo massimo di elaborazione dei frame è il valore più alto tra tutti i singoli valori di tempo di elaborazione dei frame.
Il throughput viene calcolato come il numero di frame elaborati, inclusi
quelli eliminati, diviso per il delta temporale tra i due eventi: 1) il codec invia
l'ultimo frame e 2) il codec invia il primo frame.
Scenari di test
Di seguito sono riportati i casi di test che puoi utilizzare:
Test
Velocità effettiva di decodifica
Decodifica fino a tre stream 2880 × 1880 × 30 contemporaneamente e verifica che i decoder non
violino i requisiti di prestazioni.
Conformità del decoder
Decodifica un insieme di bitstream pre-codificati. L'output del decodificatore di test deve corrispondere all'output
di un decodificatore di riferimento (libvpx per VP8 e VP9, libaom per AV1).
Scalabilità temporale
Decodifica video con più livelli temporali (2 e 3). L'output del decodificatore di test deve
corrispondere a quello del decodificatore di riferimento.
Scalabilità spaziale
Decodifica video con più livelli spaziali (2 e 3). L'output del decodificatore di test deve corrispondere
all'output del decodificatore di riferimento.
[null,null,["Ultimo aggiornamento 2025-08-29 UTC."],[],[],null,["# Video codec requirements for Meet Media API\n\n| **Developer Preview:** Available as part of the [Google Workspace Developer Preview Program](https://developers.google.com/workspace/preview), which grants early access to certain features. \n|\n| **To use the Meet Media API to access real-time media from a conference, the Google Cloud project, OAuth principal, and all participants in the conference must be enrolled in the Developer Preview Program.**\n\nThis page provides the basic requirements for Google Meet Media API client video\ncodecs to ensure a good user experience.\n\nFunctional requirements\n-----------------------\n\nThis section specifies the requirements for the codec types and features.\n\n| Feature | Requirement |||\n|------------------|--------|-------------|-----|\n| Profile | AV1 | VP9 | VP8 |\n| Profile | `Main` | `Profile 0` | N/A |\n| Scalability | Decoder must support temporal scalability, spatial scalability, or both if required by the coding specification for given codec type and profile. |||\n| Raw video format | Codec must be capable of processing odd resolutions (such as when frame width or height are not multiple of 2; for example, 133 × 141). For subsampled chroma formats, the number of chroma samples per dimension must be rounded up when derived from the number of luma samples. Cropping, padding, or scaling isn't allowed. Resolution of the output frame must match the resolution of the input frame. |||\n\nOperational requirements\n------------------------\n\nThis section specifies requirements for various conditions the video codec is\nexpected to operate in. Violation of these requirements may restrict the usage\nof the codec to a subset of scenarios but doesn't necessarily prevent it from\nbeing used. For example, if the maximum number of codec instances is less than\nrequired, the codec can still be used together with codecs of other types or\nimplementations.\n\n| Parameter | Requirement |\n|----------------------------------------------------|---------------|---|---|---|\n| Minimum resolution, pixels | ≤ 128 × 128 |\n| Maximum resolution, pixels | ≥ 2880 × 1800 |\n| Minimum frame rate, FPS | ≤ 1 |\n| Maximum frame rate, FPS | ≥ 30 |\n| Minimum bitrate, kbps | ≤ 30 |\n| Maximum bitrate, kbps | ≥ 5000 |\n| Maximum decoder instances | ≥ 3 |\n| Maximum total decode throughput, pixels per second | ≥ 3 × 2880 × 1880 × 30 ||||\n\nPerformance requirements\n------------------------\n\nThis section specifies the requirements on codec performance. Violation of these\nrequirements may significantly impact the user experience and will almost\ncertainly block the usage of the codec.\n\n| Parameter | Requirement |\n|----------------------------------------------|-----------------------------------------------|\n| Maximum inter frame processing time, seconds | ≤ `1 / max(30, encode_target_frame_rate_fps)` |\n| Maximum key frame processing time, seconds | ≤ `2 / max(30, encode_target_frame_rate_fps)` |\n\nThe frame processing time is the time difference between two events: 1) codec\ndelivers the frame and 2) codec receives the frame. The average frame processing\ntime is calculated over a sliding window of at least **10 seconds** duration\nholding at least **10 frames**. The maximum frame processing time is the highest\nvalue among all individual frame processing time values.\n\nThe throughput is calculated as the number of processed frames, including\ndropped ones, divided by time delta between the two events: 1) codec delivers\nthe last frame and 2) codec delivers the first frame.\n\nTest cases\n----------\n\nThe following are test cases you can use:\n\n| Tests |\n|----------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------|\n| Decode throughput | Decode up to three 2880 × 1880 × 30 streams simultaneously and verify that decoders don't violate the performance requirements. |\n| Decoder conformance | Decode a set of pre-encoded bitstreams. The output of the test decoder must match the output of a reference decoder (`libvpx` for VP8 \\& VP9, `libaom` for AV1). |\n| Temporal scalability | Decode video with multiple temporal layers (2 and 3). The output of the test decoder must match the output of the reference decoder. |\n| Spatial scalability | Decode video with multiple spatial layers (2 and 3). The output of the test decoder must match the output of the reference decoder. |\n\nRelated topics\n--------------\n\n- [Get started with Meet Media API](/workspace/meet/media-api/guides/get-started)"]]