El acceso cada vez mas fácil a las fuentes electrónicas de almacenamiento, ya sean bases de datos, CD-ROM, o Internet, ha originado la constitución de bases de datos textuales de gran tamaño, formadas por artículos, patentes, informes, notas técnicas y clínicas, entre otros. En el sector industrial, los proyectos tecnológicos de envergadura generan el intercambio y almacenamiento de grandes volúmenes de documentos.