Fin dalle origini i contenuti multimediali in Internet sono stati diffusi per mezzo del Word Wide Web. Il che rende il servizio semplice e di grande efficacia servendosi di protocolli di livello applicativo.
Un approccio utilizzato finora è quello di utilizzare server centralizzati (server d’origine) nella rete di backbone. Quindi i server si trovano fisicamente lontani dagli utenti. Si ha però il problema che molti client, accedendo ai medesimi dati, generano un carico su tale server e sulla rete molto elevato. Soprattutto nell’ultimo decennio il problema è diventato sempre più gravoso con l’aumento del traffico in Internet.
Tale carico può essere meglio re-distribuito per mezzo di strategie e dispositivi che permettono di fronteggiare l’aumento del traffico in rete. Allo stesso tempo, tali strategie assicurano latenze ridotte e gestiscono un’occupazione delle risorse più efficiente.
I proxy sono dispositivi di livello applicativo che replicano i contenuti e si frappongono tra client e server di origine.
Esistono due possibilità:
I reverse proxy sono un insieme di server front-end del server d’origine per ridurre il carico sul server d’origine stesso, come mostrato in Figura 12.1. In questo caso è necessario fare load balancing e i server sono vicini a quello di origine. Con questa strategia si riduce il carico del server, ma non risolve il problema di utilizzo di risorse di rete e di latenza.
I forward proxy, mostati in Figura 12.2, sono posizionati in prossimità dei client e possono essere dispiegati nella rete privata aziendale o nella rete dell’ISP. Svolgono la funzione di replica dei contenuti localmente e il load balancing è necessario sono se esistono più forward proxy locali. La posizione dei forward proxy consente il contenimento del carico di rete, solo se la replica dei contenuti è fatta in modo intelligente. Inoltre, viene sperimentata una riduzione della latenza nel reperimento dei contenuti replicati. I reverse/forward proxy d’ora in poi verranno chiamati con il termine generico di cache (o replica server).
La capacità di storage delle cache posizionate vicino agli utenti è ridotta rispetto all’intero contenuto. Quindi l’operazione di caching replica i contenuti popolari che solitamente sono quelli acceduti più frequentemente. E’ necessario che i contenuti replicati siano consistenti. La popolarità dei contenuti può essere modellata e calcolata come nella Figura 12.3.
Questa strategia funziona bene. Gli accessi ai contenuti sono spesso correlati tra di loro e si dice che presentano località.