miércoles, 4 de mayo de 2011

unterminated literal string

_ Tal vez nos hayamos topado con este mensaje en la consola de error de Firebug, pasa que javascript no lee el salto de linea \n, a veces nuestros datos proceden de administradores de contenido que son insertados copiando y pegando, y al mostrarlos nos da este error "unterminated literal string", en este post mostraré como librarnos de él en Javascript y en PHP:

En Javascript usaremos la siguiente función:
function nl2br(value) {
  return value.replace(/\n/g, "
");
}
En php usaremos la función nl2br
Asi:
echo nl2br("foo isn't\n bar");
//lo que nos dará como resultado:
foo isn't
bar

jueves, 27 de enero de 2011

Obtener los tweets un usuario

En está ocasión de una manera sencilla vamos a obtener los ultimos mensajes de un usuario que llamaremos usuariox en Twitter:

Como recordaremos en el capitulo anterior de como usar CURL para acceder a los datos de una URL EXTERNA, usaremos nuestra funcion file_get_contents_curl para acceder a los ultimos tweets de usuariox de la siguiente manera:
//nuestra función del artículo anterior:
function file_get_contents_curl($URL)
    {
        $c = curl_init();
        curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt($c, CURLOPT_URL, $URL);
        $contents = curl_exec($c);
        curl_close($c);

        if ($contents) return $contents;
            else return FALSE;
    }
//Aquí la usamos:
$jsont = file_get_contents_curl("http://twitter.com/statuses/user_timeline/usuariox.json");
$jsont = json_decode($jsont, true);
//echo $json[0]['text'];

// or display last 3
for($i=0; $i < 3 && isset($jsont[$i]); $i++) {
echo $jsont[$i]['text']."
";
}
Pero queremos mostrar como links los http, entonces haremos esto:
//con este metodo cambiaremos todos los link como http o mailto a enlaces.
function make_links_blank($text)
{
  return  preg_replace(
     array(
       '/(?(?=]*>.+<\/a>)
             (?:]*>.+<\/a>)
             |
             ([^="\']?)((?:https?|ftp|bf2|):\/\/[^<> \n\r]+)
         )/iex',
       '/]*)target="?[^"\']+"?/i',
       '/]+)>/i',
       '/(^|\s)(www.[^<> \n\r]+)/iex',
       '/(([_A-Za-z0-9-]+)(\\.[_A-Za-z0-9-]+)*@([A-Za-z0-9-]+)
       (\\.[A-Za-z0-9-]+)*)/iex'
       ),
     array(
       "stripslashes((strlen('\\2')>0?'\\1\\2\\3':'\\0'))",
       '',
       "stripslashes((strlen('\\2')>0?'\\1\\2\\3':'\\0'))",
       "stripslashes((strlen('\\2')>0?'\\0':'\\0'))"
       ),
       $text
   );
}
function file_get_contents_curl($URL)
    {
        $c = curl_init();
        curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt($c, CURLOPT_URL, $URL);
        $contents = curl_exec($c);
        curl_close($c);

        if ($contents) return $contents;
            else return FALSE;
    }
//Aquí la usamos:
$jsont = file_get_contents_curl("http://twitter.com/statuses/user_timeline/usuariox.json");
$jsont = json_decode($jsont, true);
//echo $json[0]['text'];

// or display last 3
for($i=0; $i < 3 && isset($jsont[$i]); $i++) {
echo make_links_blank($jsont[$i]['text'])."
";
}

domingo, 23 de enero de 2011

file_get_contents vs curl

A más de uno os habrá pasado que su servidor emite un warning al usar file_get_contents("URL_EXTERNA"), y es que esta función interna de PHP, expone una vulnerabilidad a la seguridad de tu aplicación web, en PHP 5 no es posible cambiar el valor de esta a on en .htaccess, tendrías que tener acceso al php.ini del servidor.
La vulnerabilidad trabaja de la siguiente manera:
_ Al usar esta función para recuperar datos desde ubicaciones remotas como un servidor FTP o sitio web y no hacer el filtro apropiado al pasar los datos, dejas abierta tu aplicación a una muy posible inyección de código.

Recomendaciones

Usted debe desactivar allow_url_fopen en el archivo php.ini:

Deshabilitar allow_url_fopen por razones de seguridad
allow_url_fopen = 'off'

Esta configuración tambien debe ser deshabilitada en apache httpd.conf

# Deshabilitar allow_url_fopen por razones de seguridad
php_flag allow_url_fopen off php_flag allow_url_fopen off


Te quedan 2 cosas por hacer:
1) O habilitas file_get_contents en el servidor con su consiguiente vulnerabilidad.
2) O usas CURL o HTTP, para acceder a contenidos de URL externa.

Recomiendo usar CURL por estas razones:
1) Es un promedio de 39% más rapido como se ve aqui.

2) Es seguro por que viene integrado con metodos internos de seguridad.

Ahora que tal vez hayas decidido decidido usar CURL te preguntaras ¿como lo hago?, ¿qué es eso?:
Acerca de CURL puedes Googlear y encontrarás mucha info de él.
Ahora vamos a usarlo.

Primero tu servidor debe de tener el módulo CURL instalado, la mayoría de servidores Apache vienen con CURL activado, si usas IIS verifica que lo tengas instalado.

Luego usarlo en tu código de esta manera:
//Puedes usarlo en una clase Helper o en una función como en el ejemplo
 
function file_get_contents_curl($URL)
    {
        $c = curl_init();
        curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt($c, CURLOPT_URL, $URL);
        $contents = curl_exec($c);
        curl_close($c);

        if ($contents) return $contents;
            else return FALSE;
    }

//Modo de uso:

$result=file_get_contents_curl("http://www.example.com");
if ($result === false)
{
    // treat error
} else {
    // handle good case
} 

Saludos.

martes, 11 de enero de 2011

Sistema Administrador de Contenidos

Despues de una para prolongada por motivos de trabajo, escribo algo sobre lo que se de CMS (Content Management System), He aquí algunos tips:


Tener en cuenta los aspectos de optimización web para el posicionamiento en buscadores a la hora de implementar un gestor de contenidos puede evitar que nuestra inversión en contenidos quede devaluada por una pobre presencia en los buscadores.


Los gestores de contenido


La generación, publicación y archivo de un enorme número de páginas en los grandes portales y sitios Web plantea múltiples retos que los sistemas de gestión de contenidos web (o CMS, de Content Management System) han tratado de resolver en los últimos años:





* Facilitar la generación y edición de contenidos para la Web por parte de personal sin formación específica en programación.


* Asegurar una apariencia homogénea de todos los contenidos y su presentación de acuerdo con un diseño corporativo y con una línea editorial predefinida.


* Mantener una coherencia en la estructura de los sitios Web, permitiendo la incorporación de nuevos contenidos en las secciones adecuadas tras la aprobación y el control previo de las personas indicadas.


* Mantener una navegación consistente que permita a los usuarios llegar a cada uno de los contenidos que están publicados en cada momento.


* Evitar la existencia de contenido duplicado (distintas direcciones URL que muestran un mismo contenido), contenido huérfano (archivos que quedan en el servidor de forma innecesaria ya que son páginas a las que ya no apunta ningún enlace o archivos de imagen o multimedia que se mostraban en páginas suprimidas) o bien enlaces rotos, que apuntan a páginas que no existen en el servidor.





Los gestores de contenidos o CMS son herramientas de software que permiten descentralizar las labores de mantenimiento del contenido de un portal, de forma que personal no técnico de los distintos departamentos de una empresa puede añadir, editar y gestionar su propio contenido en una Web corporativa.


CMS y posicionamiento en buscadores: ¿una simbiosis imposible?


Sin embargo, y a pesar de sus evidentes ventajas, el enfoque tradicional de este tipo de herramientas se ha centrado en facilitar al máximo la gestión de los contenidos simplificando los procesos de producción, aprobación y publicación de los mismos, más que en generar páginas web debidamente optimizadas para ser competitivas en los buscadores.


Los factores que hacen que un portal web sea amigable para los buscadores se analizaron en distintos artículos de esta sección, así como en la Guía Básica de Posicionamiento en Buscadores.


Entre los problemas que, desde el punto de vista de la optimización para el posicionamiento en buscadores, aparecen de forma recurrente en los portales soportados por sistemas gestores de contenido, destacan los siguientes:





* URLs dinámicas: los buscadores limitan en ocasiones el número de variables dinámicas presentes en las URLs que indexan. Las páginas generadas por muchos gestores de contenidos incluyen frecuentemente un elevado número de variables dinámicas en su dirección URL.


* Títulos únicos: el título de una página es uno de los factores más importantes a la hora de posicionar bien en buscadores un contenido. Sin embargo, muchos sistemas gestores de contenidos no permiten a los usuarios asignar un título único relevante a cada página.


* Falta de soporte para metaetiquetas: muchos CMS no disponen de campos específicos para que el usuario pueda especificar el contenidos de las metaetiquetas Keywords y Description. Aunque no son tan importantes como el título para lograr una buena posición en los buscadores, estas etiquetas siguen jugando un papel relevante a la hora de que el usuario prefiera hacer click sobre nuestro sitio en una página de resultados de búsqueda.


* Ausencia de palabras clave en las URL: las URLs dinámicas generadas por muchos sistemas de gestión de contenido suelen ser poco amigables tanto para el usuario como para los buscadores, y no incluyen términos de búsqueda que contribuyen a un mejor posicionamiento.


* Imposibilidad de una optimización posterior: el proceso de producción de contenidos que impone el uso de un sistema CMS dificulta enormemente la optimización a posteriori de los contenidos generados y, en el mejor de los casos, añade una carga de trabajo extra que podría evitarse si los aspectos SEO se hubieran tenido en cuenta en la implementación del gestor.





Resulta, pues, paradójico que precisamente sean aquellas empresas que más recursos invierten en el mantenimiento y generación de nuevos contenidos para sus portales las que, al mismo tiempo, menos se beneficien del volumen que dicho tráfico podría movilizar debido a una pobre implementación de sus sistemas de gestión de contenidos, desde el punto de vista del posicionamiento en buscadores. Un fallo que, en muchos casos, no se debe a carencias de la herramienta en sí, sino a un desconocimiento por parte de los técnicos que la implementan de la importancia que tiene que los contenidos generados por ella puedan ser competitivos en los buscadores.


Hacer del gestor de contenido la mejor herramienta SEO


Pero, de la misma forma que un gestor de contenidos mal implementado puede mermar el rendimiento de la inversión en generación de contenidos de un portal, uno que haya tenido en cuenta los aspectos básicos de la optimización web para el posicionamiento en buscadores puede ser el aliado más eficaz para generar contenidos que conseguirán escalar los puestos de las búsquedas más competidas. Veamos cómo.





*


Emplear código valido según W3C: los gestores de contenido parten de plantillas prediseñadas, que los usuarios no pueden alterar, para generar las nuevas páginas. Si validamos el código de estas plantillas en origen, nos aseguramos de que las páginas generadas a partir de ellas contendrán también código válido. El empleo de código válido asegura que la página se mostrará correctamente en los distintos navegadores y que los buscadores serán capaces de rastrearla sin problemas.


*


Crear un mapa del sitio: casi todos los gestores de contenidos permiten crear y mantener actualizado un mapa del sitio. Los buscadores limitan el número de enlaces que pueden seguir a 100 por página y han de ser enlaces normales de texto HTML. Si ajustamos nuestro gestor de contenido para que genere y mantenga un mapa jerárquizado del sitio web con estas premisas, facilitamos a los buscadores que puedan rastrear todas y cada una de las páginas de nuestro sitio web.


*


Generar páginas con URLs amigables: algunos gestores de contenido generan archivos estáticos cuyas URL no contienen variables dinámicas, mientras que otros emplean direcciones URL con múltiples parámetros dinámicos, como por ejemplo: http://www.midominio.org/portal/site/Equipo /menuitem.6dab26af2ec93c76a68e76b1805101ca/?vgnextoid=88c8c55c1edb7010VgnVCM100000081510acRCRD. Entre éstos últimos, algunos permiten crear URL alias más amigables (conteniendo palabras clave o eliminando los parámetros dinámicos) que después el sistema sustituye internamente por la URL dinámica que precisa. En igualdad de condiciones, elijamos un CMS que genere direcciones URL ricas en palabras clave o con un reducido número de parámetros dinámicos. Direcciones URL como la del ejemplo son muy poco usables así como poco amigables para los buscadores.


*


Limitar el nivel de subdirectorios: los buscadores dan mayor importancia a una página cuanto más cerca está de la página home del portal. Es por esto que debemos limitar el número de subdirectorios que muestra la URL: muchos gestores de contenidos permiten organizar jerárquicamente el contenido independientemente de la localización física de los archivos en el servidor, presentando URLs mucho más sencillas que la estructura real del directorio correspondiente. Por ejemplo, la URL http://www.midominio.com/Viajes/Destinos/Ciudades/MasInfo/Datos Generales/Congresos/Congresos_negocios.htm hace que este contenido esté situado seis niveles de profundidad por debajo de la página home.


*


Conectar el control de validación de enlaces del CMS: la mayoría de gestores controla la publicación de enlaces rotos que apuntan a contenidos controlados por el propio gestor, pero pocos validan que un enlace que apunta a una web externa no es un enlace roto. Si el control existe, asegurémonos de conectarlo para impedir que un usuario pueda introducir un enlace hacia una página web inexistente.


*


Dejar el control del archivo robots.txt al webmaster: algunos gestores de contenidos permiten editar el contenido del archivo robots.txt por parte del autor de una página. En general, es mejor que sólo el webmaster controle el contenido de este archivo para impedir que, por desconocimiento, un usuario pueda bloquear el rastreo de los robots de una importante parte de la Web.


*


Evitar URLs duplicadas: los buscadores son tremendamente selectivos a la hora de castigar el contenido duplicado de una Web, de modo que debemos asegurarnos de que cada página sólo existe bajo una única URL. En cualquier caso, si queremos que los usuarios puedan llegar a un mismo contenido desde URLs homólogas, es mejor programar redireccionamientos permanentes 301, que no son castigados por los buscadores.


*


Evitar variables de sesión en la URL: si nuestro portal realiza transacciones electrónicas o algún otro proceso que requiera mantener el estado del cliente, es preferible emplear una cookie de sesión que una variable de sesión que aparece en la URL. La razón es que si los buscadores detectan esto, se abstendrán de rastrear la página para evitar indexar como páginas distintas la misma, pero con distinta variable de sesión. Por ejemplo: http://www.midominio.com/index.php?module=Health&action=DefaultIndex&PHPSESSID=98ab41f9acd8c74df4b6e063985bda8d. En esta URL podemos ver que existe un parámetro de identificación de la sesión (PHPSESSID) que, si es detectado por los buscadores, impedirá que la página sea rastreada, ya que sucesivas visitas del buscador archivarían como páginas distintas ésta misma, en la que únicamente cambiaría el valor del identificativo de sesión. En cualquier caso, se debe restringir el empleo de identificadores de sesión exclusivamente a las áreas del portal en los que sea absolutamente necesario.


*


Reducir el código basura: simplificar el código HTML que emplean las plantillas y optar por usar Hojas de Estilo en Cascada (CSS) en lugar de tablas para maquetar el contenido. El empleo de Hojas de Estilo en Cascada facilita la actualización del diseño de una Web, reduce considerablemente el peso de los archivos (la maquetación viaja una sola vez del servidor al usuario, después está ya disponible en la memoria temporal o caché del navegador para las siguientes páginas visitadas) y da mayor preponderancia al contenido significante de la página respecto al peso total del código de la misma.


*


Seleccionar la opción de texto para la navegación del sitio: evitando siempre que sea posible el uso de menús Javascript o Flash, ya que sus enlaces no pueden ser seguidos por los buscadores. En muchos casos, podremos lograr con el uso de CSS efectos parecidos a los de los menús Javascript o Flash. Si el gestor de contenidos permite crear un rastro de migas de pan (breadcrumb), activémoslo. Mejora la usabilidad del sitio, ayuda a situarse al usuario en el conjunto de la estructura de la web y es un inmejorable atajo para que los buscadores rastreen todo el contenido.


*


No olvidar que existen los encabezamientos: el uso de estilos nos hace olvidar la existencia de etiquetas HTML de jerarquía (H1, H2, H3, etc.) cuyo aspecto visual final podemos modificar también con estilos, pero que ayudan a los buscadores a entender mejor la estructura lógica de la página y señalizan qué aspectos son más importantes. Es por ello importante animar a los editores de contenido a usar encabezamientos en lugar de simplemente definir el texto más grande o más pequeño con font size y, si es posible, limitar a un único encabezamiento de máximo nivel (H1) por página.


*


Exigir la creación de un título único, y la adición de metaetiquetas relevantes: programar el CMS de tal forma que la cumplimentación de título y metaetiquetas sea un requisito para la publicación del contenido y, si es posible, activar un control para comprobar la unicidad del título.


*


Requerir cumplimentar la etiqueta alt al añadir una imagen al contenido. Esta etiqueta permite a los buscadores indexar mejor las imágenes, colabora en la relevancia de los términos clave de la página y mejora la accesibilidad a los contenidos por parte de las personas con problemas de visión.


*


Implementar controles para evitar la publicación de contenido duplicado.


*


Animar a usar textos descriptivos en enlaces: en lugar de "Haga click aquí", emplear "Más información sobre nuestro servicio de asistencia al cliente 24H".





Lo mejor de ambos mundos


Es evidente, pues, que si al implementar un gestor de contenidos para generar y mantener el contenido de un gran portal se tienen en cuenta los aspectos relacionados con la optimización web y el posicionamiento en buscadores de dicho portal podemos animar o, de alguna forma, imponer una cierta disciplina a través del propio sistema CMS que implique a los editores de contenido a crear páginas fácilmente rastreables e indexables, que puedan competir adecuadamente en los buscadores.


Las grandes empresas cuentan con la materia prima favorita de los buscadores: contenido abundante, original, dinámico y de rápida actualización. Aprovechemos toda la capacidad de los gestores de contenidos para extraer el máximo rendimiento de la inversión que efectúan en su presencia en la Red.

http://www.articuloz.com/marketing-en-internet-articulos/como-aprovechar-su-gestor-de-contenidos-para-tener-una-web-bien-posicionada-en-buscadores-216344.html