Le flux Visites de Data Flow permet de récupérer toutes les visites générées sur une plage horaire, avec ces propriétés (navigateur, géolocalisation, page d'entrée, etc.).
Certaines de ces propriétés sont définies dès la première page de la visite et ne varieront pas au cours de la visite :
- Géolocalisation
- Navigateurs
- OS
- Pages d'entrée
- Sources
- Supports
- Trafic contrôlé
- Trafic horaire
- Visiteur Unique ID
D'autres, au contraire, sont dynamiquement mises à jour avec les différents événements reçus au cours de la visite comme :
- Pages vues par visite
- Temps passé par visite
- Pages de sortie
- Visiteurs identifiés
- Degré d'implication
Les valeurs de ces propriétés sont donc amenées à changer si tous les événements des visites n'ont pas été générés sur la plage horaire demandée.
Cas d'usage
Voici 3 visites, qui ont toutes débuté entre 10h00 et 11h00 :
Scénario 1
Si vous récupérez les flux toutes les 30 minutes, vous allez recevoir 2 fichiers :
- 10:00:00 à 10:29:59 qui contiendra les visites suivantes :
Visit ID | Page d'entrée | Page de sortie | Pages Vues par Visite | Visiteur ID |
1 | Page A | Page J | 3 | - |
2 | Page F | Page G | 2 | DEF |
- 10:30:00 à 10:59:59 qui contiendra les visites suivantes :
Visit ID | Page d'entrée | Page de sortie | Pages Vues par Visite | Visiteur ID |
3 | Page A | Page D | 3 | GHI |
Scénario 2
Si vous récupérez les flux toutes les heures, vous allez recevoir 1 seul fichier :
- 10:00:00 à 10:59:59
Visit ID | Page d'entrée | Page de sortie | Pages Vues par Visite | Visiteur ID |
1 | Page A | Page D | 5 | ABC |
2 | Page F | Page G | 2 | DEF |
3 | Page A | Page D | 3 | GHI |
Que se passe-t-il si une visite ne commence pas par une page ?
Si une visite commence par un événement autre qu'une page, certaines propriétés de visite ne seront pas remplies avant que la première page de la visite soit chargée.
Prenons l'exemple suivant :
Si vous avez mis en place un export automatisé toutes les 30 minutes, la visite sera présente dans 2 fichiers :
- Fichier "01:00:00:00 à 01:29:59" : la visite sera présente dans le fichier, sans aucune information sur la Source, la Géolocalisation, l'OS, le Périphérique, etc. car ces propriétés sont peuplées uniquement sur les événements de page.
- Fichier "01:30:00 à 01:59:59" : la visite sera également présente dans le fichier, avec toutes les propriétés de visite remplies.
Cela signifie que, lors de l'insertion des données dans votre base de données, vous devez dédupliquer les lignes en fonction du "Visit ID" et ne conserver que les lignes où les propriétés de visite sont remplies.
Ceci s'applique également aux exports horaires si la visite commence par un événement autre qu'une page avant N:59:59 et qu'une page est suivie après N+1:00:00.
Recommandations
Comme vous le voyez dans les scénarios ci-dessus, l'heure à laquelle vous allez faire appel à la donnée est déterminante. Certaines propriétés étant valorisées APRES l'appel à la donnée.
Vous pouvez donc faire un premier appel en continu, en utilisant les exports de fichiers toutes les 30 ou 60 minutes pour avoir les données les plus fraiches possibles, mais également planifier une récupération par API des données consolidées dans la nuit pour récupérer toutes les données qui sont calculées une fois la visite terminée.