Archive for the “Web Semántica” Category

Cuando ya estamos empezando a digerir la Web 2.0, aparece otro término por internet que día a día toma más fuerza, la Web 3.0 aunque este post no es para hablar de dicho concepto, si no más bien, de una de las tecnologías que lo acompañan, la web semántica.

Web semántica, unas palabras muy escuchadas pero poco explicadas y que, a menudo, generan confusión. En este post intentaré explicar que es eso de la web semántica ya que poco a poco me estoy sumergiendo en este mundo.

A día de hoy los buscadores solo pueden llegar a entender que palabras introducimos en el mismo, pero eso solo, entienden las palabras por separado y no una oración entera, o lo que es lo mismo, con semántica.

En otras palabras, agregar semántica a la World Wide Web, o lo que es lo mismo, a internet.

Hagamos una prueba, busquemos en Google una capital, por ejemplo, ‘capital de España‘. El famoso buscador nos dice en las primeras entradas que Madrid es la capital de España.

Probemos ahora con Yahoo! a realizar la misma busqueda, obtenemos la respuesta en los primeros resultados.

El sistema de búsqueda tampoco es muy complicado, tenemos dos sustantivos y una preposición. Cualquier buscador decente recoge la fuerza de los dos sutantivos y obtenemos la respuesta a nuestras plegarias.

Pero, ¿que ocurre si la cadena de búsqueda es más compleja?.

Intentemos ahora realizar una búsqueda un poco mas compleja, como soy sevillista, vamos a realizar una búsqueda relacionada con mi equipo de fútbol: quien fue pichichi en el sevilla fc. La búsqueda nos ha devuelto diversos resultados ordenados según las palabras ‘pichichi’, ‘sevilla’ y ‘sevilla fc’. Como hicimos anteriormente, realicemos la misma búsqueda en Yahoo!, y ninguno de los resultados expuestos nos sirve.

Como hemos demostrado, los buscadores actuales se rigen por ofrecer resultados que contengan las palabras que estamos buscando, o como hace Google, ofrecer aquellas webs que tengan más visitas y que contengan dichas palabras. En otros números de este post hablaremos del funcionamiento de Google.

Si juntamos las palabras “capital” y “España”, es muy común que nos estemos refiriendo a la capital de dicho país, pero en cambio, en cuanto buscamos algo con más sentido, en este caso, una persona relevante de un equipo de fútbol, el buscador ya no es tan exacto. A lo mejor, en uno de los resultados expuestos obtenemos la respuesta a nuestras plegarias, pero en cambio, tenemos miles de resultados que no nos sirven y nos hacen perder el tiempo.

La web semántica intenta solucionar este problema, introducimos más significado dentro de las webs y así nuestras búsquedas serán más exactas.

A día de hoy las páginas webs están compuestas de la siguiente forma:

Es decir, relaciona una web con otra sin preocuparse que tipo de relación puede haber entre una y otra.

El principal lenguaje para la creación web, HTML, es un lenguaje en el que poca información podemos introducir. Cuando me refiero a información hablo de semántica. Está claro que dentro de un documento HTML podemos dividir que es el título de la web, que es el cuerpo, pero, por ejemplo, dentro de un catálogo no podemos decir que el producto X es un producto tal con un precio y unas características indicados.

Con la web semántica conseguimos que entre una web y otra, haya una serie de relaciones que sean capaces de ofrecernos más información acerca de las mismas.

La idea principal es poder conseguir que nuestras máquinas puedan entender y, por lo tanto, utilizar, el contenido web. Con esto quitamos carga de trabajo al usuario y optimizamos los resultados (buscadores).

La cuestión que nos plantea todo esto es la siguiente, ¿como hacemos esto?, es decir, ¿como hacemos para que las máquinas entiendan que les estamos pidiendo, por ejemplo, en un buscador?. Necesitamos dos cosas, una de ellas son los metadatos:

Metadatos (del griego μετα, meta, «después de» y latín datum, «lo que se da», «dato» ), literalmente «sobre datos», son datos que describen otros datos. En general, un grupo de metadatos se refiere a un grupo de datos, llamado recurso. El concepto de metadatos es análogo al uso de índices para localizar objetos en vez de datos. Por ejemplo, en una biblioteca se usan fichas que especifican autores, títulos, casas editoriales y lugares para buscar libros. Así, los metadatos ayudan a ubicar datos.

Y ontologías:

El término ontología en informática hace referencia a la formulación de un exhaustivo y riguroso esquema conceptual dentro de un dominio dado, con la finalidad de facilitar la comunicación y la compartición de la información entre diferentes sistemas.

Un documento HTML puede ser todo lo caótico que queramos, por ello, necesitamos una serie de herramientas que los PCs puedan utilizar para entender que contiene esa web.

A mi forma de ver hay dos enfoques para conseguir esto, o hacemos las máquinas más inteligentes (Inteligencia artificial – buscadores semánticos), o hacemos los documentos más inteligentes (enfoque de la web semántica).

¿Que herramientas tenemos para conseguir esto?, las herramientas propuestas por el W3C son los metalenguajes, es decir, XML, XML Schema, RDF, RDF Schema y OWL, de los que hablaremos en otras ediciones.

¿Por que he mencionado la IA anteriormente?…, un buscador semántico es un tipo de software, un software que debe extraer y entender los documentos que le proporcionemos y es este sistema quien debe entenderlos y decidir cuando parar, es decir, cuando ha encontrado aquello que le estábamos pidiendo.

El tema de la web semántica es un tema muy extenso donde entran en juego la informática, las matemáticas, la lengua, e infinidad de puntos extras. Pongamos un ejemplo, con este sistema, una máquina debe llegar a comprender que estamos buscando, como lo buscamos y cuando lo hemos encontrado, es decir, en cierta medida, se debería comportar como un humano y decidir por él.

Por último decir que esta filosofía ya se aplica en cierta medida, las etiquetas <meta> del lenguaje HTML están diseñadas para que los robots/arañas de internet puedan realizar de forma más eficiente su trabajo.

1
<meta name="propiedad" content="valor">

He aquí un ejemplo sencillo de una etiqueta .

En siguientes posts trataré de explicar los diversos lenguajes que se utilizan como herramientas y otros aspectos de interés de la web semántica.

Comments No Comments »

   Beat diabetes   Diabetes diet