8 de julio de 2007

¿Qué es la web 2.0?

No hace mucho alguien me preguntó sobre la web 2.0. Qué era eso, que si funcionaba ya, que si había que cambiar el navegador para poder usarlo, que si aquello funcionaría más rápido, etc. etc. Esto me dio a entender que la gente no entiende bien el concepto web 2.0, lo cual es lógico por otra parte. Sirvan las siguientes líneas para ilustrar de forma sencilla qué es este invento.

Hasta ahora las páginas web se escriben en HTML. Este lenguaje es un sistema de marcado, es decir lo que se hace es decir qué es lo que hay a continuación.

Un ejemplo:

<h1>Esto es un título de primer nivel</h1>

La línea anterior indica que se debe de mostrar un título de primer nivel. Esto lo sabemos porque entre las dos etiquetas h1 especificamos que lo que hay dentro es un título de primer orden. Cuando este texto llega al navegador lo transforma en algo visualizable según lo que se le indique y según el tipo de navegador que usemos.

De la forma anterior podemos hacer una página web, tenemos etiquetas para muchas cosas, no las voy a mencionar aquí. Si queremos cambiar la apariencia podemos ayudarnos de una CSS u hoja de estilo para definir colores, anchos de líneas, etc. Podemos usar incluso javascript, flash, ajax para conseguir una mayor interactividad con nuestra página y hacerla mejor a todos los efectos.

Todo esto está muy bien pero tiene un problema bastante interesante. HTML es un lenguaje de marcado, esto quiere decir que no aporta semántica al contenido. Veamos lo que esto quiere decir con un ejemplo.

<p>
Título: Necronomicon
Autor: Abdul Alhazred
Editorial: Miskatonic University
<p>

Las líneas anteriores definen un párrafo de la página web en el que se muestra información sobre un libro. El navegador cuando lee esto únicamente sabe que tiene que mostrar un párrafo con todo lo que tenga dentro. Cuando un buscador de páginas web como Google o Yahoo indexa la página no puede saber ni que Necronomicon es el título del libro, ni que Abdul Alhazred es el autor ni que la Miskatonic University es la la editorial que lo ha publicado. No hay forma de que el buscador con la información dada en ese punto pueda saber qué es cada cosa.

¿Cómo se puede hacer que el buscador sepa lo que es cada cosa? Aunque parezca mentira este es un problema bastante complejo. No voy a entrar muy en detalle, únicamente daré algunas ideas del mismo. Para poder solucionar el problema tenemos que dotar de semántica al contenido, y únicamente con HTML no podemos hacerlo porque es un lenguaje de marcado. ¿Entonces? La solución se basa en usar XML combinado con HTML o lo que es lo mismo XHTML.

Al usar XHTML podemos hacer todo lo que hacíamos con HTML y algo más. Este algo más es dotar de semántica a las cosas. Esta semántica se basa en etiquetas del tipo <libro>Necronomicon</libro>. Pero ahora surge otro problema, un libro en inglés es book, en alemán buch, en francés livre y así sucesivamente. Esto quiere decir que dependiendo del creador de la página web la etiqueta la pondría en su propio idioma. Además dependiendo del lenguaje puede adquirir varios significados, carro puede ser un coche o un vehículo tirado por caballos. Aquí es donde entran en juego los estándares.

Los estándares intentar homogeneizar la forma de representar las etiquetas anteriormente mencionadas. Estos estándares deben de definir claramente como nombrar los elementos y cuál es su semántica. Un ejemplo sería Dublin Core que estandariza la forma de etiquetar libros. Si en una página web yo quiero listar un libro, debería hacerlo utilizando las etiquetas proporcionadas por el estándar. De esta forma un buscador al entrar en mi página sabrá que le estoy hablando de un libro.

¿Qué ventajas me ofrece todo esto? Pues muchas y muy variadas. Supongamos que queremos todos los libros de la editorial Anaya, cuyo autor se llama Jose y que están editados en Barcelona. Vamos a google e introducimos la siguiente búsqueda "libros anaya autor jose publicados madrid". Lo que obtenemos no es lo que queremos. ¿Por qué no funciona esta búsqueda? Sencillamente porque el buscador realiza las búsquedas por frecuencia de palabras, no por etiquetas con semántica. Lo que nosotros le estamos pidiendo es una lista concreta y definida, pero en su lugar él busca una página donde la frecuencia de aparición de las palabras nos indique la respuesta a la pregunta. La anterior búsqueda es mucho más compleja y el buscador no puede resolverla. Con la web 2.0 este tipo de búsquedas podrían ser una realidad.

El concepto de buscar en Internet cambia. Hasta ahora preguntamos por una página que nos responda a la pregunta, lo que ahora pretendemos es obtener directamente la respuesta de la web. Podrían darse búsquedas tan ambiciosas como "tienda con sede en Barcelona donde el libro 1984 de Orwell con el menor precio". Lo que la web 2.0 busca es algo muy, muy ambicioso: la unificación de todas las páginas web para formar una única y (más o menos) homogénea base de datos. Esto lanzaría nuestro potencial para buscar información a unos límites que todavía no conocemos. Además de facilitar de forma muy interesante la interacción entre las máquinas.

¿Tiene desventajas? Por supuesto. La web 2.0 avanza despacio por una cuestión de interbloqueo. Todas estas etiquetas y semántica hay que añadirlas manualmente, o en su defecto programar sistemas para añadirlas. Esto como es lógico requiere mucho trabajo. Por otro lado el web master pregunta si esto verdaderamente beneficia a su sistema, el experto le dirá que sí pero que no verá las ventajas inmediatamente, sino que requiere su tiempo. Aquí está el interbloqueo: hay que trabajar mucho para con el tiempo conseguir resultados, y lo que es peor, hay que confiar en que el resto de la gente también esté trabajando.

¿Cuándo llegará? Pues es difícil de decir. Por el momento se trabaja mucho en la web 2.0 y cantidad de nuevos sistemas lo tienen en cuenta en sus diseños. Pero su implantación de forma generalizada promete ser toda una revolución.

Espero que esta pequeña guía haya aclarado algunos conceptos.

1 comentario:

Fco. Javier dijo...

¿Por qué me haces esto? Qué angustia más tonta me ha entrado leyéndolo. Maldito PFC, no podría escribirse solo :____(