Soubory přehledů Přenosu dat poskytují neagregované údaje na úrovni událostí z reklamních kampaní. Tato data jsou v podstatě nezpracovaný obsah z protokolů reklamního serveru Ad Manager, se samostatným souborem vygenerovaným pro každý typ události. Soubory Přenosu dat obsahují na sekundu přesná data o událostech a můžete do nich nechat zahrnout další informace, abyste získali informace o zařízení, geografické oblasti a další údaje související s událostí. Aby se reklamní jednotky partnerům zobrazovaly v souborech Přenosu dat, musí je ve službě Ad Manager schválit.
Začínáme
Soubory přehledů Přenosu dat jsou k dispozici za poplatek. Pokud tuto funkci chcete aktivovat, kontaktujte svého správce účtu. Po aktivaci této funkce můžete nastavit typy souborů Přenosu dat. Služba Google Ad Manager nabízí pro přenos dat dvě možnosti: CSV a Parquet.
Pokud vaše organizace nedokáže spravovat extrakci, transformaci a načítání (ETL), podporovat velké soubory, manipulovat s textovými soubory, navrhnout a spravovat středně velký datový sklad a vytvářet a implementovat skripty, zvažte spolupráci se schváleným partnerem Google Marketing Platform.
Dostupné soubory přehledů Přenosu dat
Každý soubor Přenosu dat obsahuje informace o různých událostech. Do jednotlivých typů souborů můžete přidat pole k zobrazení kontextových informací souvisejících s těmito událostmi.
Backfill
, soubor Network
nezahrnuje zobrazení z Ad Exchange nebo AdSense realizovaná prostřednictvím dynamické alokace. K získání informací o dynamicky alokovaných zobrazeních použijte soubor Backfill
.O datech obsažených v souborech Přenosu dat
- Zpožděná data
Několikahodinová zpoždění jsou běžná, ale občas zpracování souborů Přenosu dat trvá déle než obvykle. Pokud jsou data k dispozici se zpožděním, jsou s přesným časovým razítkem zahrnuta do souboru pro další hodinu. Soubor tak například může obsahovat většinou časová razítka od 8:00 do 9:00, ale také několik starších časových razítek, u nichž se zpracování zpozdilo. -
Hodiny bez aktivity
Pokud během určité hodiny nedošlo k žádné aktivitě, vygeneruje se prázdný soubor Přenosu dat, který obsahuje pouze záhlaví. - Hranice dat a dní
První hodinový soubor pro den obvykle obsahuje události od půlnoci do 1 hodiny ráno severoamerického pacifického času, ale časová razítka událostí jsou v časovém pásmu sítě majitele stránek. Pokud má například majitel stránek časové pásmo nastavené na severoamerický východní čas, v souboru pro první hodinu uvidí události z období od 3 do 4 hodin ráno. Předchozí tři hodiny by byly uvedeny v souboru z předchozího dne. Datum v časových razítkách se proto může lišit od data v názvu souboru. Vždy používejte časová razítka událostí v souboru, nikoliv čas publikování souboru nebo název souboru. - Zahrnutí hlavních/doprovodných kreativ v Přenosu dat
Soubory Přenosu dat zahrnují zobrazení hlavní kreativy i doprovodných kreativ. Dotazovací nástroj však započítává pouze zobrazení celé sady s hlavní kreativou a doprovodnými kreativami, nikoliv zobrazení jednotlivých kreativ (pokud informace nejsou rozděleny podle hlavní kreativy a doprovodných kreativ).
U zobrazení doprovodných kreativ je v poliIsCompanion
hodnota „TRUE“ (pravda). PoleCreativeId
obsahuje ID jednotlivých kreativ (hlavních a doprovodných), nikoliv ID sady kreativ. Dodatečné pole pro ID sady kreativ, pomocí něhož by zobrazení doprovodných kreativ bylo možné spojit se zobrazeními hlavních kreativ, v Přenosu dat není. - Nesrovnalosti s přehledy služby Ad Manager
Z přehledů služby Ad Manager a přehledů generovaných pomocí rozhraní API se pravidelně odstraňuje neplatný provoz a spamová data. V souborech Přenosu dat toto čištění vzhledem k časovému plánu publikování nemusí být plně reflektováno. Přenos dat tak může ukazovat mírně vyšší počet zobrazení, kliknutí nebo jiných událostí. Pokud se vyskytnou nesrovnalosti, obvykle činí cca 1 %.Soubory Přenosu dat
CodeServes
mohou ukazovat vyšší hodnotu než metrika Počet zprostředkování kódu v přehledech služby Ad Manager. Přenos dat totiž zprostředkování kódu započítává u každého realizovaného zobrazení, zatímco v přehledech se u každé žádosti započítává jen jedno zprostředkování kódu. Některé formáty kreativ, například textové reklamy Google Ads, mohou v jedné žádosti obsahovat několik zobrazení. Jedinečná zobrazení k porovnání najdete tak, že soubory Přenosu dat seskupíte podle hodnot poleKeyPart
.
Výhody a nevýhody výstupních formátů CSV a Parquet
CSV (hodnoty oddělené čárkami) | Parquet (sloupcové úložiště) | |
---|---|---|
Čitelnost a přístupnost | Dobře čitelné pro lidi. Lze je snadno otevřít a upravit pomocí základních textových editorů nebo tabulkového procesoru. | K zobrazení a úpravě jsou potřeba specializované nástroje. Není snadno přístupné pro uživatele bez technických dovedností. |
Univerzálnost a kompatibilita | Podporováno prakticky ve všech nástrojích pro analýzu a zpracování dat. | K zajištění plné kompatibility mohou být potřeba další knihovny nebo software, zejména ve starších systémech. |
Jednoduchost a snadnost použití | Jednoduchá struktura. Snadno pochopitelné a zpracovatelné, zejména u menších souborů dat nebo rychlých ad hoc analýz. | Implementace může být zpočátku složitější, zejména pro uživatele, kteří nejsou obeznámeni se sloupcovými úložišti. |
Výkon a efektivita | U velkých souborů dat může být kvůli ukládání po řádcích a absenci komprese pomalejší. | Díky sloupcovému ukládání a efektivní kompresi nabízí vynikající výkon při zpracování a analýze velkých objemů dat. |
Efektivita úložiště | Menší efektivita úložiště z důvodu absence integrované komprese a možnému ukládání nadbytečných dat. | Velmi efektivní využití úložiště díky sloupcovému ukládání a pokročilým kompresním algoritmům, které snižují náročnost na úložiště. Soubory Parquet mohou být o 50–75 % menší než soubory CSV, zejména u velkých souborů dat. |
Pokud už máte Přenos dat aktivovaný ve formátu CSV a chcete získat přístup k formátu Parquet, kontaktujte svého správce účtu.
Stažení ukázkového souboru
V těchto souborech ke stažení ve formátu CSV nebo Parquet si můžete prohlédnout náhled dat a polí, která obsahují jednotlivé soubory s přehledy Přenosu dat.
Typ události | Název a typ souboru | Co ukazuje | Ukázkový soubor |
---|---|---|---|
Propojitelná nabídka | NetworkBackfillBidsJoinable |
Informace o cenových nabídkách. Lze kombinovat s dalšími soubory Přenosu dat. Jednou za hodinu. |
|
Zprostředkování kódu | NetworkCodeServes |
Zaznamenává každou odpověď ze služby Ad Manager bez ohledu na to, zda byla stažena. Dvakrát za hodinu. Poznámka: Soubory s informacemi o žádostech (Request) a zprostředkováních kódu (CodeServer) jsou bez dalších poplatků zahrnuty se souborem s informacemi o zobrazeních (Impression). |
|
Zobrazení | NetworkImpressions |
Informace o stažených zobrazeních. Dvakrát za hodinu. |
|
Požadavek | NetworkRequests |
Zaznamenává každou žádost o reklamu, kterou služba Ad Manager obdržela, bez ohledu na to, zda byla vyplněna. Dvakrát za hodinu. Poznámka: Soubory s informacemi o žádostech (Request) a zprostředkováních kódu (CodeServer) jsou bez dalších poplatků zahrnuty se souborem s informacemi o zobrazeních (Impression). |
|
Active View | NetworkActiveViews |
Informace o zobrazeních ze služby Ad Manager vhodných pro Active View. Dvakrát za hodinu. |
|
Nabídka | NetworkBackfillBids (verze beta) |
Informace o cenových nabídkách v aukci od inzerentů Authorized Buyers a z Otevřených nabídek. Jednou za hodinu. |
|
Kliknutí | NetworkClicks |
Informace o kliknutích. Dvakrát za hodinu. |
|
Minimální cenová nabídka k vítězství | NetworkMinimumBidToWin (verze beta) |
Udává minimální cenovou nabídku, kterou kupující potřebovali k vítězství v aukci, když soutěží alespoň jedna zbytková řádková položka. Jednou za hodinu. |
|
Konverze rich media | NetworkRichMediaConversions |
Informace o událostech služby Studio, včetně standardních i vlastních akcí (například přehrání a pozastavení), trvání akce a podobně. Dvakrát za hodinu. |
|
Konverze videa | NetworkVideoConversions |
Informace o událostech specifických pro video, včetně akcí (například, přehrání a pozastavení), ID obsahu, umístění v podu a dalších. Podívejte se na všechny události videí Dvakrát za hodinu. |
Jak jsou soubory doručovány
Soubory Přenosu dat se každou hodinu přidávají do segmentů cloudového úložiště služby Ad Manager. Doporučujeme v pravidelných intervalech kontrolovat dostupnost aktualizací. Většina dat je doručena a dostupná od 5 do 15 hodin po zaznamenání. U některých zpožděných událostí však data mohou být k dispozici až za 8 dní po události. Služba Ad Manager informace z Přenosu dat nedoručuje na servery třetích stran.
Názvy souborů obsahují počáteční hodinu událostí v severoamerickém pacifickém čase (se zohledněním letního času), ale časová razítka v souboru jsou vždy uvedena v časovém pásmu sítě Ad Manager (v němž se letní čas používat nemusí). Vzájemné působení těchto nastavení časových pásem může vést k prázdným (přeskočeným) souborům nebo k souborům s daty za více než jednu hodinu.
Při přechodu ze zimního na letní čas a zpět se doručují všechna data o zobrazeních.
Názvy souborů
Názvy souborů Přenosu dat odpovídají této konvenci:
- CSV:
[Typ]_[ID sítě]_[RRRRMMDD]_[HH].gz
- Parquet: budou dodány ve složce s názvem
[Typ]_[ID sítě]_[RRRRMMDD]_[HH]/
, která obsahuje rozdělené soubory s názvy[Typ]_[ID sítě]_[RRRRMMDD]_[HH]-[Index oddílu]-z-[Celkový počet oddílů].parquet
RRRRMMDD
je rok, měsíc a den.HH
je počáteční hodina ve 24hodinovém formátu.Hodina (01, 02, 03) uvedená v každém názvu souboru je v severoamerickém pacifickém čase, ale z časových razítek v souborech Přenosu dat získají majitelé stránek údaje v časovém pásmu své sítě. Při výpočtech souvisejících s doručením souboru to mějte na paměti.
[Index oddílu]
: Pořadové číslo oddílu v souboru ve vztahu k celkovému počtu vytvořených souborů (oddílů). Číslování začíná od nuly.[Celkový počet oddílů]
je počet souborů (oddílů) použitých k vytvoření souboru.
Soubory Přenosu dat v procesu žádání o reklamu
Následující grafika ukazuje typy souborů Přenosu dat přidružené k různým fázím procesu žádání o reklamu.
Použití souborů s přehledy Přenosu dat
Po nastavení Přenosu dat se budou soubory ukládat do segmentů cloudového úložiště služby Ad Manager. Můžete s nimi pracovat na webu, pomocí nástroje příkazového řádku nebo prostřednictvím rozhraní API. Další informace o tom, jak pracovat se segmenty cloudového úložiště služby Ad Manager
Pokud příjem a analýzu dat omezíte na určitou sadu souborů Přenosu dat na základě počáteční hodiny v názvu souboru, můžete přehlédnout data poskytnutá v následujícím souboru (kvůli přechodu mezi zimním a letním časem, zpožděnému sběru dat nebo jiným podobným scénářům). Lepší je načíst všechny soubory Přenosu dat do samostatného systému (například do datového skladu nebo dotazovacího stroje) a omezit analýzu podle časových razítek událostí.
Soubory Přenosu dat jsou k dispozici ve dvou formátech: CSV a Parquet.
Uživatelé mohou u každého souboru vybrat formát CSV, Parquet nebo oba. Formát Parquet je optimální pro použití v datových skladech a zpracování, zatímco soubory CSV lze v závislosti na velikosti souboru použít v tabulkovém editoru. Zde je několik typických příkladů použití informací z Přenosu dat:
- dimenzionální uživatelská agregace událostí a aktivit (například podle kreativ),
- spárování uživatelů s databází zákazníků,
- vytváření přehledů s geografickými a demografickými informacemi o uživatelích.
Pomocí identifikačních tabulek lze pro hodnoty v souborech Přenosu dat poskytnout párování ID s názvy, a přiřadit tak informace o zobrazování reklam (jako je reklamní jednotka nebo řádková položka) k předem přiřazeným hodnotám uloženým v databázi.
Místní ukládání souborů
Obecné pravidlo je, že každá událost v komprimovaném souboru zabere 25 až 35 bajtů. Deset milionů zobrazení by tedy v komprimovaném souboru CSV zabralo přibližně 300 MB místa na disku. Při použití výstupního formátu Parquet můžete očekávat menší velikosti souborů. Jedná se však pouze o odhady. Vaše soubory by mohly být o něco větší. Protože se jedná o velikost dat v komprimované podobě, potřebujete také další prostor k rozbalení a použití souborů.
Soubory Přenosu dat starší než 60 dní se ze služby Ad Manager mažou. Pokud soubory chcete ponechat uložené déle než přidělených 60 dní, doporučujeme vám buď si je uložit lokálně, nebo přejít na trvalé cloudové úložiště, například na nezávislý účet služby Google Cloud Storage, nad kterým máte plnou kontrolu.
Informace o službě BigQuery Data Transfer Service
Zjednodušení zpracování velkých souborů Přenosu dat
Na webu Google Code je k dispozici sada nástrojů open source CRUSH (Custom Reporting Utilities for Shell) ke zpracování textových dat s oddělovači pomocí příkazového řádku nebo shellových skriptů. Nástroje CRUSH byly důkladně testovány a nejlépe fungují v operačních systémech Linux a Unix. Podporu nástrojů CRUSH zajišťuje komunita open source.
Alternativou, která není open source, je DMX, software pro integraci dat vyvinutý společností Syncsort.