La rappresentatività dei campioni dei rispondenti alle indagini online è da sempre un tema al centro dell'attenzione di chi intende valutare dal punto di vista metodologico la qualità delle ricerche su Internet.
Il tema è spesso presentato in modo problematico perchè nelle ricerche online gli effetti negativi nel processo di produzione dei campioni di rispondenti sono visibili in modo evidente.
Si tratta di due effetti che si sommano e producono una distorsione del campione dei rispondenti che mina la capacità di rappresentatare la collettività che si intende esaminare:
  1. il campionamento di una popolazione di flusso, che assegna maggior probabilità di presenza nel campione agli individui alto-frequentanti. Il sovracampionamento degli individui segnati da elevato consumo è un aspetto è particolarmente evidente nelle intercept surveys ma dal suo effetto negativo non sono immuni nè i panel nè le ricerche su liste di individui
  2. gli effetti dell'autoselezione dei rispondenti, che esaltano alcune caratteristiche sociodemografiche e attitudinali
Le diverse esperienze di ricerca online che abbiamo condotto su OpLine, su campioni di utenti Internet e su campioni di Customer Base, ci hanno confermato che nel processo di indagine online si produce una distorsione delle caratteristiche della popolazione iniziale che opera su alcune variabili di profilo. Tale distorsione è ben osservabile e attribuibile con un peso misurabile ai due fenomeni descritti in precedenza. La cosa sorprendente è che tale distorsione si verifica sempre con le stesse modalità e sulle stesse variabili, indipendentemente dal sistema di indagine, dal canale di invito e dalle caratterisiche dell'insieme di partenza.
La dinamica della distorsione dei campioni online non trattati è quindi un fenomeno sistematico e ben prevedibile. Come tale è controllabile nelle sue conseguenze, come altri fattori distorsivi noti nelle ricerche tradizionali e trattati nell'ambito di una precisa metodologia.

Human Highway ha sviluppato un proprio approccio al campionamento online. Il campione di partenza viene inizialmente prodotto sulla base delle caratteristiche dell'universo che intende rappresentare ed è successivamente trattato per aumentare la densità dei rispondenti a bassa propensione di partecipazione.
La rappresentatività del campione viene in definitiva conquistata a scapito della numerosità dei rispondenti poichè tale approccio produce una riduzione consistente del numero di casi utili. Un panel o un campione non trattato, infatti, può risultare 10 volte più numeroso dell'informazione campionaria che esso contiene.