Selv store medier fejler
Spor ikke brugernes identitet
Webanalyse er ikke let, og det må selv store medier erkende.
Google Analytics retningslinier er ganske klare: Man må IKKE spore noget, som kan identificere brugeren personligt. Det må altså ikke være muligt at kunne kæde en given adfærd sammen med en unik person.
Og hvorfor så nævne dette? Jeg har tidligere bemærket at der i links fra nyhedsbreve indgår mailadressen i sitets Google Analytics kampagnesporing (som content – utm_content). Men seneste opdagelse viser at der er langt igen for webanalyse, ikke blot i Danmark, men i store dele af verden. For det sidste nyhedsbrev jeg så hvor mailadressen indgik i URL´en og kampagnesporingen, var fra Businessweek.com.
Google Analytics retningslinier
Når man opretter en Google Analytics konto accepterer man bl.a. følgende:
7. PRIVACY . You will not (and will not allow any third party to) use the Service to track or collect personally identifiable information of Internet users, nor will You (or will You allow any third party to) associate any data gathered from Your website(s) (or such third parties’ website(s)) with any personally identifying information from any source as part of Your use (or such third parties’ use) of the Service. …
Der står altså helt tydeligt: Du må ikke kunne identificere brugeren personligt.
Businessweek.com sporing
Det lidt sjove er at der faktisk ikke længere er Google Analytics på Businessweek.com. De har rodet sitet godt ind i diverse andre værktøjer, men GA ser ud til at være fjernet. Det betyder ikke at email-adressen ikke kan spores, for det er blot at lave et filter ud fra hvilken email entrypage URL indeholder.
Indlægget kom ikke kun pga. denne ene case, men er også påvirket af at et unavngivent større dansk firma, som KUN beskæftiger sig med email-udsendelse som default (altså vis man klikker kampagnesporing til) sætter content=email. Da jeg påpegede det var der tilmed uvilje mod at gøre noget som helst ved sagen.
Der er langt igen…
Forståelsen for webanalyse har langt igen. Men jeg troede faktisk i højest grad det var omkring vigtigheden af korrekt og avanceret implementering, validiteten af implementeringen, analysen og brugen af resultaterne. Men nej, det gælder tilsyneladende også den lettere lemfældige måde at omgås de retningslinier der er stukket ud.
Så moralen er: Udsender du nyhedsbreve, så sørg lige for IKKE at spore brugerens email, når de kommer ind på sitet.
Selv store medier fejler,
Er det også grunden til at man ikke kan spore hver enkelt session i GA? Eller er det bare mig der ikke kan finde det?
Jeg sidder nogle gange og følger enkelte besøgendes tur igennem butikken med Woopra og det kan faktisk være ganske lærerigt at se hvordan hver enkelt bevæger sig gennem sitet. Men det kan man vist ikke i GA?
Der er ingen tvivl om, at det også er et følsomt emne, fordi man jo på ene side ønsker at anvende sporingsdata til intelligens, og den anden side ikke ønsker at Google (el. anden) skal vide for meget om os rent personligt.
Jeg synes at mit billede af Google er, at de sniger sig ind på mine personlige data i form a Google Toolbar, Google Desktop. Deres online services er jo ret intelligente. Jeg mindes også, at de selv har haft mistænkelige sager om halsen, om emnet med om de ved for meget om os eller ej og hvor lang tid de må lagre data om os.
Men det jo ikke sikkert at de selv bruger GA hehe, fordi hvordan ser lovgivningen egentlig ud, jeg har en rimelig fornemmelse af spam, persondata lagring, men hvad med sporing? Hvad jeg er bekendt med må man fx ikke kæde log-filer sammen med persondatabaser, og det er måske det Google Analytics også underordner sig?
Det med sporing fra nyhedsbreve er et ret unikt område, hvor jeg i hvert fald arbejder med nogle danske samarbejdspartnere, som jeg synes bør have en anden holdning til deres lagring af sporingsoplysninger.
Men det kan da være vi skal til at skubbe lidt til dem
Pingback: www.anyhed.dk
Der er selvfølgelig mange flere dybder af dette emne, og jeg har kun kigget på mail-adressen i linket. For selvfølgelig kan man have sine overvejelser med Googles produkter.
Jeg er fx ikke vild med at offentlige sites bruger gratis-systemerne og deler de private data.
Men mit indlæg er faktisk vendt lidt om – Google skriver jo netop at man ikke må spore på enkeltpersons niveau, men at medierne ikke kan finde ud af det. Jeg tror ikke man skal lægge noget større i at de har fjernet GA fra sitet, det er nok bare manglende webanalyse strategi og eksekvering at det sker uden at man justerer kampagnesporingen.
@Jacob: Både woopra og YWA giver mulighed for at se enkelte brugeres adfærd (ja og Clicktale ikke mindst), men essensen er at man ikke må kæde denne specifikke adfærd sammen med et navn/person. Så du må fx godt spore at en bruger er logget ind, men du må ikke spore at det er Fru Hansen i nr. 16.
Ved du om det måske er noget der kunne være på vej til GA?
Men omvendt, så når man siger statistik, så tænker man jo også mere på at observere en gruppe af personer og ikke bare den enkeltes adfærd. Så det kan godt være det egentlig er mest for sjov og ikke så anvendeligt.
Det er ikke nødvendigvis helt korrekt Jakob.
Hvis du ser Creunas seminar http://bit.ly/1iNJru med Eric T. Peterson en Analytics ekspert som siger, at de forretninger som vinder på markedet er dem som formår, at man kan lave det nødvendige “drill-down” på sin analyse. Eks.: Du får via en survey at vide at dit website ikke ser godt ud, Eric T. Peterson forklarer nu, at det vitalt for ikke at lave fejlvurderinger, at du nøjagtig ved hvilke sider denne bruger har set, det kunne jo være at brugeren bare har set en README fil og ja klart nok
Og ja – man ved måske ikke lige, hvad brugeren hedder, men med en e-mail adresse er det muligt eller hvad man nu angiver i en survey eller lign. er man så gået for vidt eller ej?
@Jacob: Jeg tror ikke GA går den retning. Når de mere “generelle” funktioner er færdigudviklet (såsom flere costum var), så tror jeg i højere grad vi vil se integration med deres andre værktøjer såsom GWO.
@Kevin: Well, jeg fik snakket med Eric inden, så de tips har han fra mig Du har helt ret, det er meget relevant at se præcis hvilke sider de brugere som er mest tilfredse har set (Se evt. http://www.webanalytiker.dk/analyser/adfaerdsbaseret-brugeranalyse/ hvor jeg har skrevet om præcis dette emne), og også selv om det er en enkelt person. MEN, det må ALDRIG kædes sammen med et specifikt navn eller mail. Og ja, man indsamler typisk mailadresser ved surveys fordi man laver en konkurrence, men der skriver man netop også at mail og svar ikke bliver sammenkædet.
Så hvis der er analyseinstitutter/analytikere, som rent faktisk sammenkæder disse ting på trods af at de angiver andet, så er det yderst kritisk. Derfor tror jeg heller ikke det er noget der sker, og i al fald kun i meget lav grad.
Generelt set er mulighederne der helt sikkert (fx når du sporer ordre ID i din e-commerce kode), men der er langt fra at have muligheden, til at udføre det og overtræde de regler (skrevne som uskrevne) der er i branchen.
Hej! Tak for en spændende blog.
Jeg har et begynder-spørgsmål, som jeg måske burde kunne læse ud af kommentarerne, men ikke desto mindre er meget i tvivl om.
Google Analytics “forbyder” sporing af identificerbare individer kan jeg forstå, men er der også decideret dansk lovgivning imod dette..??
På forhånd tak for uddybende svar.
@Christian Ja det er der, uden lige at kunne henvise til en lovtekst så har jeg tidligere gransket en del persondata lov ifm. hosting relateret arbejde. Og da er jeg stødt på at hosting af servere jo omfatter log-filer, og at man ikke må kæde log-fil-data sammen med en brugers persondata fx navn, adresse, cprnr osv.
Én ting er at det er muligt og i nogen tilfælde rigtig svært at undgå, men det må ikke bruges systematisk på noget måde.
Og min vurdering er at om det er logfiler eller data i Google Analytics, Web Trends og lign. så må disse data som @Jacob tidligere skrev ikke kædes sammen med et navn, adresse, cprnr og den slags.
Mange tak for uddybningen. Men ØV. Jeg havde nøje planlagt, hvordan jeg skulle få min programmør til at lave en nyt statistik-modul til vores shop sder sporede på brugerniveau..
Jeg er næsten sikker på, at DynamicWeb sporer åbning af nyhedsbreve på brugerniveau, så det må jo også være imod reglerne..
Faldt lige over denne post: http://www.techcrunch.com/2009/11/13/google-voice-privacy-policy/ hvor Google ikke overholder deres egen policy.
De er igang med at udbedre det, men det nager mig lidt at Google som er lidt et græsrodsfolk, web-hippies om man vil, set i forhold til IBM, Oracle, Microsoft m.fl. som jeg let får sympati for, ikke magter at have styr på sådan noget.