Una guía para proteger nuestros ordenadores y a nosotros mismos. Hacer frente a la represión y entender una cultura de seguridad. Esta guía está destinada a usuarias de Windows, Linux y Android. Cuando decimos Linux, y esto es durante toda la guía, nos referimos a Ubuntu y derivados.
Convertir un HTML a PDF en Ubuntu
10 septiembre 2008 por neonigma
Hoy necesitaba pasar el manual de Gentoo Linux 2008.0 sin red que tenía en HTML a formato PDF. Una vez más, me puse a buscar a ver qué nos ofrecía Ubuntu gratuitamente para este cometido.
Ha sido gratificante descubrir una aplicación como doc, que se puede instalar junto a una librería para convertir .chm de esta forma:
sudo apt-get install libchm-bin htmldoc
Una vez hecho esto, escribiendo htmldoc en la consola accedemos al programa que nos muestra la figura:
Pulsando en el botón Add files o en el botón Add URL añadiremos el origen HTML a convertir. En las opciones de salida tengo puesto lo siguiente:
Existe una particularidad y es que los PDF generados sólo admiten codificación iso, como puede verse en la siguiente imagen:
Esto ocasiona que si generamos un PDF de un HTML capturado en Ubuntu, nos saldrá con los típicos acentos raros debido a la codificación UTF-8. Esto lo solucionamos fácil, recodificando el archivo a codificación latin1 y dándoselo como entrada a doc. La recodificación es de la siguiente forma:
recode utf8..latin1 archivo.html
"En marzo entrará en vigor la legislación antidescargas. Obviamente, no va a servir de nada: las páginas que pretendan cerrar podrán ser reabiertas en otros sitios, y los bloqueos que pretendan llevar a cabo para impedir el acceso a las mismas no van a funcionar, salvo que el usuario no sepa hacer la O con un canuto...."