La mecánica cuántica podría mejorar las búsquedas en la web

Una técnica matemática empleada en el estudio de un desorden en los sistemas cuánticos podría mejorar las búsquedas de palabras clave en internet. Esta técnica es capaz de señalar patrones significativos en grandes conjuntos de datos tales como páginas web o documentos de textos, y podría incluso adaptarse a los análisis de genomas.

Las búsquedas estándar de palabras claves comparan la frecuencia con que aparece una palabra en un documento, con las frecuencias en un cuerpo de texto estándar proveniente de varias fuentes. Si una palabra en el documento aparece más frecuentemente que la media, se la considera importante.

El nuevo método calcula la importancia de las palabras en un documento en base al lugar en el que aparecen, en lugar de simplemente en base a sus ocurrencias. “”Deberíamos de ser capaces de detectar la propiedad intrínseca de un libro sin necesidad de compararlo con diferentes libros”, comenta Pedro Carpena, físico de la Universidad de Málaga en España.

La importancia de las palabras en un documento podrían basarse en el lugar en el que aparecen, en lugar de en su frecuencia.

Carpena había usado previamente las matemáticas de un campo llamado teoría de matrices aleatorias para analizar sistemas cuánticos. Según él, la misma técnica podría usarse para identificar palabras principales en los documentos (Physical Review E, vol 79, p 035102).

Las palabras importantes tienden a agruparse juntas, comenta Carpena, mientras que las menos importantes aparecen distribuidas de forma más aleatoria. Esto tiene un sentido intuitivo, añade, a medida que los autores desarrollan ideas importantes es probable que usen palabras relevantes varias veces en el mismo párrafo o página antes de abordar otras ideas. Las palabras menos importantes tales como “y” o “pero” tienden a aparecer de un modo más uniforme a lo largo del texto.

La técnica ha funcionado bien en los textos elegidos por Carpena. Aplicando la teoría de matrices aleatorias sobre un libro de Albert Einstein titulado Sobre la teoría especial y general de la relatividad para extraer palabras clave, el resultado fue que “universo”, “campo”, “gravitatorio” y “energía” aparecían entre los 10 resultados principales.

El método podía generar palabras claves útiles incluso cuando Carpena eliminó los espacios en blanco de un documento de texto y le pidió a la computadora que identificara las combinaciones de letras significativas de longitudes entre 2 y 35 caracteres. Esto sugiere que podría funcionar incluso en conjuntos de datos más abstractos. Carpena y sus colegas están en la actualidad probando su idea con el genoma humano para ver si puede extraer información útil sobre los genes.

No está claro si el método de búsqueda es superior a los ya existentes, dice Oren Etzioni, científico computacional de la Universidad de Washington en Seattle. Etzioni señala que Carpena tiene aún que comparar sus resultados con los métodos existentes.

“A menudo, los grandes descubrimientos se realizan cuando se prueban las técnicas de una disciplina en otra. Esto es potencialmente muy prometedor, pero están adentrándose en un campo muy trillado”, comenta Etzioni.

Traducido de Quantum mathematics could improve web searches

3 Comentarios

  1. 1 Willy Willy 6 Abr 2009 0 (0 Votos)

    Pues vamos a ver que pasa, por el momento debemos de aprender a convivir con el algoritmo del PR de Google, que es el que manda.

  2. 2 ezeqdb ezeqdb 6 Abr 2009 0 (0 Votos)

    Creo que a falta de una inteligencia artificial real estamos tratando de desmembrar lo que significa la inteligencia y la comprensión de un texto.

    Y cuando hayamos descubierto la suficiente cantidad de técnicas y algoritmos para aplicar a un buscador (en este caso) será imposible discernir entre un ser vivo inteligente y uno programado.. que finalmente pase el test de Turing.

    Y cuando eso suceda, volveremos a los mismos interrogantes que comenzó Asimov, planteando sociedades donde ésto ya había pasado, y las consecuencias sociales, políticas, culturales, económicas, etc en esos mundos.

  3. 3 Andres Schuschny Andres Schuschny 6 Abr 2009 0 (0 Votos)

    La cuántica siempre mejora todo pues es un orden superior de aproximación Dx a la realidad, respecto de la “realidad clásica”…. es tema es que estamos tan inmersos en la lógica clásica que negamos la intuición de los operadores cuánticos por encontrarla “incomprensible”.
    Felicitaciones por el blog.
    Muchos saludos

2 Trackbacks / Pingbacks

  1. chuenga.net
  2. meneame.net

Deja una respuesta

Tu correo nunca será publicado. Los campos obligatorios están marcardos con *

Obligatorio
Obligatorio

Patrocinadores

Twitter

  • No public twitter messages

Flickr

  • Una foto de Flickr
  • Una foto de Flickr
  • Una foto de Flickr
  • Una foto de Flickr
  • Una foto de Flickr
  • Una foto de Flickr
  • Una foto de Flickr
  • Una foto de Flickr
  • Una foto de Flickr