Convertir un HTML a PDF en Ubuntu
10 septiembre 2008 por neonigma
Hoy necesitaba pasar el manual de Gentoo Linux 2008.0 sin red que tenía en HTML a formato PDF. Una vez más, me puse a buscar a ver qué nos ofrecía Ubuntu gratuitamente para este cometido.
Ha sido gratificante descubrir una aplicación como doc, que se puede instalar junto a una librería para convertir .chm de esta forma:
sudo apt-get install libchm-bin htmldoc
Una vez hecho esto, escribiendo htmldoc en la consola accedemos al programa que nos muestra la figura:
Pulsando en el botón Add files o en el botón Add URL añadiremos el origen HTML a convertir. En las opciones de salida tengo puesto lo siguiente:
Existe una particularidad y es que los PDF generados sólo admiten codificación iso, como puede verse en la siguiente imagen:
Esto ocasiona que si generamos un PDF de un HTML capturado en Ubuntu, nos saldrá con los típicos acentos raros debido a la codificación UTF-8. Esto lo solucionamos fácil, recodificando el archivo a codificación latin1 y dándoselo como entrada a doc. La recodificación es de la siguiente forma:
recode utf8..latin1 archivo.html