POR QUÉ UNA CACHÉ NO SOLUCIONA EL PROBLEMA AL 100% - Guatemala Marketing
 

POR QUÉ UNA CACHÉ NO SOLUCIONA EL PROBLEMA AL 100%

POR QUÉ UNA CACHÉ NO SOLUCIONA EL PROBLEMA AL 100%

POR SUERTE, HAY UNA MUY BUENA SOLUCIÓN AL PROBLEMA ANTERIOR: USAR UNA CACHÉ DE PÁGINAS.

La idea básica es muy sencilla: una caché aprovecha el HTML creado en la ejecución de una página dinámica PHP y lo convierte en una página estática HTML, es decir, crea literalmente un fichero con ese código HTML como si fuese una página estática tradicional y lo guarda como tal en el servidor web.

Si otro usuario accede a la misma página y la aplicación detecta que no ha habido cambios en ella, en vez de acceder de nuevo a la BD MySQL  y procesar el PHP, sirve directamente el fichero anteriormente guardado. Resultado: mucha más velocidad y mucho menos carga para el servidor, por tanto, mucha más capacidad de tráfico.

WordPress y Joomla, por ejemplo, disponen de plugins que implementan este tipo de cachés.

Hasta aquí la solución es perfecta, incluso con un hosting básico y económico, pero de calidad como Webempresa o Hostgator, que son los que recomendamos en este blog, la capacidad del sitio sube a muchas miles de páginas al día sin problemas.

Pero como verás ahora, hay un problemilla que nos agua la fiesta y mucho…

… las (malditas) URLs parametrizadas.

Una URL parametrizada tiene este aspecto:

http://www.ciudadano2cero.com/hosting-hostgator/?utm_source=rss& utm_reader=feedly

Es decir, una URL parametrizada tiene un “apéndice” con parámetros que empieza con “?” y una lista de parámetros. En el ejemplo, “utm_source” y “utm_reader” son los nombres de los parámetros y “rss” y “feedly” los correspondientes valores.

El ejemplo es un ejemplo real simplificado (he eliminado varios parámetros) de las URLs que en este caso usa el lector RSS Feedly en sus entradas. Es decir, cuando un usuario hace clic para irse a la web original de un post de su feed, la URLs que se usa es de este tipo.

Hay muchas fuentes que usan URLs de este tipo. Otro ejemplo típico son las URLs acortadas de Twitter y las de otros acortadores.

Si te interesa el tema blogging, tampoco te pierdas nuestra recopilación de los mejores recursos para blogs & bloggers

En principio, una URL de este tipo es algo muy útil porque a través de los parámetros permite pasar información útil al servidor. En este caso, por ejemplo, son parámetros para Google Analytics que desde nuestro servidor se pueden pasar a su vez a Analytics para saber cuánta gente accede vía un lector RSS al blog. Esto permite discriminar las fuentes de tráfico en nuestra analítica web.

Pero hay un gran problema: para WordPress la URL parametrizada de arriba es una página diferente a la URL “normal” que sería ésta:

http://www.ciudadano2cero.com/hosting-hostgator/

Y con razón es así porque normalmente los parámetros afectan al contenido de la página, es decir, que diferentes parámetros suponen diferentes contenidos en la página aunque las diferencias sean sólo matices.

Lo puñetero de todo esto es que siendo así, cada URL parametrizada diferente supone una nueva página PHP que se procesa completamente desde cero sin poder aprovechar la caché. Incluso para un proveedor como Webempresa, que es el proveedor con los servidores más holgados que hemos probado hasta la fecha, esto supone una carga importante para sus servidores.

En el caso de Feedly, por ejemplo, no es muy grave porque la URL parametrizada es la misma para todos los lectores, se procesa una vez, se cachea y los subsiguientes accesos ya se sirven desde la caché. El problema es que hay otras fuentes que pueden generar un pico de tráfico intenso al generar tráfico a través de muchas URLs parametrizadas distintas a la vez. En nuestro caso, por ejemplo, nos ocurrió con el tráfico procedente de Twitterfeed.

Si tienes un blog WordPress, tampoco te pierdas nuestra recopilación de los mejores plugins de WordPress

Si tu sitio web empieza a tener tráfico, empezará a haber muchos sitios con diferentes parámetros que provocan que tu caché no se aprovecha al 100% porque muchas de las páginas se procesan una y otra vez “tontamente” metiendo mucho más carga al servidor.

Por la naturaleza intrínseca del problema éste se agrava conforme tu sitio gane popularidad. Así que, como ves, ¡también aquí la fama tiene su precio!

CONTENIDO PRESTADO DE CIUDADANO2CERO