Cum sunt stocate și afișate datele

[GA4] Despre eșantionarea datelor

Ce este eșantionarea datelor

Eșantionarea datelor este procesul prin care se analizează un subset de date pentru a descoperi informații semnificative dintr-un set mai extins de date. Această practică vă permite să preluați datele mai rapid, cu un impact minim asupra calității datelor.

De exemplu, dacă doriți să estimați numărul arborilor de pe o suprafață de 100 de hectare, unde distribuția copacilor este destul de uniformă, ați putea să numărați copacii de pe un hectar și să înmulțiți cu 100 sau să numărați copacii de pe o jumătate de hectar și să înmulțiți cu 200, pentru a obține o reprezentare exactă a întregii suprafețe.

De ce vedeți eșantionarea datelor

În Google Analytics, eșantionarea datelor poate avea loc atunci când numărul de evenimente folosite pentru a crea un raport, o explorare sau o solicitare depășește limita cotei pentru proprietatea dvs. Când se întâmplă acest lucru, Analytics folosește o parte din date, apoi le scalează pentru a oferi rezultate corecte, reprezentative pentru toate datele.

Când rezultatele dvs. folosesc eșantionarea, acest lucru este indicat în pictograma pentru calitatea datelor, cu procentajul de date folosite pentru determinarea rezultatelor. Cu cât dimensiunea eșantionului este mai mare, cu atât rezultatele sunt mai precise.

Care sunt limitele

Limita cotei pentru interogările la nivel de eveniment este de 10 milioane de evenimente pentru proprietățile Google Analytics standard și de până la un miliard de evenimente pentru proprietățile Google Analytics 360.

Pentru a vă oferi rezultate precise și mai rapide, proprietățile Google Analytics 360 au o valoare prestabilită de 100 de milioane de evenimente pentru fiecare interogare. Când este necesară o precizie sporită, cu ajutorul pictogramei pentru calitatea datelor puteți accesa limita de eșantionare mai ridicată în Explorați, selectând Rezultate mai detaliate.

Ce se întâmplă cu datele neeșantionate

Pentru rapoartele bazate pe date complete, Google Analytics folosește HyperLogLog++ (HLL++) pentru a estima numărul exact de valori distincte pentru cele mai frecvent folosite valori, cum ar fi Utilizatori activi și Sesiuni. Folosirea HLL++ asigură performanțe mai bune, o precizie mai mare a estimărilor și intervale de eroare mai mici. Puteți folosi HLL++ și cu datele Google Analytics din BigQuery. Aflați mai multe despre aproximarea numărului unic în Google Analytics.

Notă: în majoritatea cazurilor, ratele de discrepanță sunt mai mici de 1 %, dar pot fi mai mari, în special atunci când combinați mai multe valori HLL++. Google Analytics folosește schița HLL++ 14. Aflați mai multe despre schițele HLL++.

A fost util?

Cum putem să îmbunătățim această pagină?
Căutare
Șterge căutarea
Închide căutarea
Meniu principal
1649061116428444518
true
Căutaţi în Centrul de ajutor
true
true
true
true
true
69256
false
false
false
false