Alfabetización informacional

Buscando información

Buscando información

13 de septiembre : día del bibliotecario

13 de septiembre : día del bibliotecario

miércoles, 15 de julio de 2009

Indización automática

Los textos que aparecen en los documentos se escriben en lenguaje natural y, por lo tanto, están sujetos a las imprecisiones y ambigüedades del lenguaje natural: polisemia, homonimia, sinonimia, anfibologías, metáforas, anáforas, etc. que impiden la identificación entre un significante y un significado, entre una palabra y un único significado concreto y preciso.
Tradicionalmente, en la búsqueda y recuperación de la información, tanto la clasificación como la indización manual han sido dos procesos básicos del análisis del contenido bien sea utilizando vocabularios controlados, o por medio de términos libres. Y de igual forma, la clasificación y la indización informatizadas para la búsqueda y recuperación de información, se han convertido en dos de las bases fundamentales para el tratamiento del contenido de los documentos digitales. Existen actualmente muchos softwares documentales que se basan en el lenguaje natural para las búsquedas en bases de datos por ordenador, pero también, la indización y clasificación automáticas han evolucionado mucho desde los inicios, con lenguajes totalmente libres, hasta el uso creciente de tesauros y ontologías totalmente automatizados, y el desarrollo de lenguajes con posibilidad de una estructuración semántica muy rica que favorecen la búsqueda y recuperación de información online.
Caracterizar el contenido de un documento sigue siendo una tarea compleja tanto en su vertiente manual como en la vertiente automatizada, puesto que la indización depende no sólo del conocimiento y control de los lenguajes y técnicas documentales, sino también del grado de conocimiento que se tenga sobre el tema o materia de que trate el documento e, incluso, de la facultad y dominio en el manejo de procesos de abstracción conceptual. Para la indización se suele echar mano de los títulos, encabezados, párrafos introductorios, resúmenes, conclusiones, etc. Y también de otros elementos más complejos basados tanto en la función sintáctica de palabras y expresiones, como en la función semántica de los términos que aparecen en los textos, y otras estrategias como la repetición de palabras, acudir al ámbito del saber en el que se enmarca el texto, etc.

No hay comentarios:

Publicar un comentario

Conozcamos la biblioteca más grande del mundo