Etiquetas

miércoles, 27 de junio de 2012

Convertir pdf a formatos e-book

Los lectores de libros electrónicos -también conocidos como eReaders- son una realidad, inclusive en lugares del globo en donde debemos pagar un poco más por ellos. Mi modesta experiencia me indica que pese a todos los pronósticos y vaticinios apocalípticos sobre la muerte del libro tradicional o "papel", el libro electrónico viene a ser un complemento a ellos.
En esta ocasión pongo a disposición un procedimiento que encontré, luego de bucear un poco en google y hacer mis propias pruebas para convertir archivos pdf por ejemplo revistas electrónicas -pongo como ejemplo la revista brasileña "Espírito Livre" que suelo leer- al formato más amigable para lectores electrónicos, por ejemplo el Kindle de Amazon.

Al buscar un lector de libros electrónicos o e-Books, me preocupó bastante que tuvieran soporte para formato pdf ¿La razón principal? Que muchos de los contenidos que leo vienen en ese formato, por ejemplo la revista brasileña Espírito Livre ( http://www.revista.espiritolivre.org/ ). La misma es en mi opinión una revista muy interesante sobre Linux/GNU, tecnología y cultura libre. Este año viene con algo de atraso en sus ediciones debido a que estuvieron muy activos en la organización de un encuentro o congreso.

Conversión

Yo había intentado leer revistas como Espírito Livre en el celular, pero el tamaño del dispositivo junto con el diseño a dos columnas de la revista complicaba mucho la lectura.
El PDF va bien en computadoras de escritorio, pero en lectores portables como el Kindle u otros dispositivos similares ese formato resulta lento y dificil de leer.
Dicho eso, se hacía imprescindible convertir los PDFs a un formato "amigable" para el eReader, en el caso del Kindle de Amazon ese formato es el "mobi" o mobipocket.
¿Y qué hace falta para lograr una buena conversión? Dos softwares excelentes: calibre (http://www.calibre-ebook.com/) y k2pdfopt (http://www.willus.com/k2pdfopt/). El primero es un gestor completísimo de libros electrónicos de código abierto, mientras que k2pdfopt es un adaptador de pdf a la estructura necesaria para los lectores (eReaders). K2pdfopt hace la magia necesaria para que la conversión sea bastante exitosa. Incluso, en textos con varias columnas -como es el caso de la revista del ejemplo, E.L) k2pdfopt las convierte a un única columna, lo que es indispensable para una lectura ágil en el lector electrónico.

Sinceramente, hasta este momento, no tengo certeza si k2pdfopt es de código abierto, pero en compensación hay binarios disponibles para usar en Linux/GNU, Mac y Windows.

Manos a la obra

1) Hacerse del software:

Para descargar e instalar Calibre, por ejemplo en Debian (hay versiones para Windows, Mac además de Linux /GNU)

Calibre usa intensivamente Python, así que por si acaso es bueno preparar algunas dependencias:
aptitude install python-beautifulsoup python-cherrypy3 python-clientform python-cssutils python-django python-django-tagging python-encutils python-mechanize python-pypdf
Luego, para instalar calibre desde su repositorio oficial:
python -c "import sys; py3 = sys.version_info[0] > 2; u = __import__('urllib.request' if py3 else 'urllib', fromlist=1); exec(u.urlopen('http://status.calibre-ebook.com/linux_installer').read()); main(install_dir='/opt')"
Suele ser recomendable instalar Calibre desde su repositorio oficial porque tendremos una versión más reciente que la disponible en el repositorio de paquetes de nuestra distribución Linux/GNU.
Nótese que al final del mini script python que hace la descarga se puede configurar el directorio en donde se instalará (ej. opt, /usr/local/share). Donde gusten.
Descargar k2pdfopt:
Simplemente descargar desde http://www.willus.com/k2pdfopt/download/ y guardar el binario (ejecutable) en un directorio local (ej. /usr/local/bin) y dar permisos de ejecución.
Ahora, a convertir se ha dicho:

En el directorio local donde tengamos el pdf de la revista o libro ejecutaremos:

k2pdfopt -ui- -col 2 -j 0 -gs -x Revista_EspiritoLivre_036__marco2012.pdf
La opción -col 2 es importante para los documentos diseñados a dos o más columnas, como es Espírito Livre. Eso le indica a k2pdfopt que intente convertir a una única columna.
El comando de arriba producirá un nuevo pdf, de más páginas y mayor tamaño en bytes, pero con un formato adaptado al lector electrónico. Por ejemplo el archivo resultante puede llamarse Revista_EspiritoLivre_036__marco2012_k2opt.pdf.

Calibre entra en escena: Hecha la magia de k2pdfopt, ahora Calibre se encarga de lo que mejor hace. Convertir entre los diversos formatos de archivo y e-books. Se puede usar desde la consola (CLI) o desde su interfaz gráfica (GUI).
Lo más rápido y directo puede ser la GUI. Para convertir sólo hay que añadir el pdf que nos entregó k2pdfopt y seleccionar como archivo de salida a "mobi", y dejar que Calibre haga su trabajo.
Y a disfrutar de Espírito Livre o cualquier otra revista electrónica en el eReader.

Continuar »

martes, 5 de junio de 2012

Se viene Firefox 13

Firefox 13
Se viene el nuevo Firefox 13

El lanzamiento de la versión número 13 del navegador de la Fundación Mozilla está previsto para hoy, 5 de junio.



La Comunidad de desarrollo de Mozilla, junto con la Fundación Mozilla anuncian para hoy el lanzamiento de la versión número 13 del popular navegador Web, Firefox.

Entre otras mejoras se incluye la optimización del uso del protocolo SPDY, desarrollado por Google, el cual permite la aceleración de carga de sitios web, reduciendo el tiempo requerido en relación con el protocolo http.

Para conmemorar este nuevo lanzamiento de Firefox, que no se detiene en su objetivo: hacer una mejor Web, equiscentrico incluye desde hoy un banner de Firefox a la derecha de su plantilla gráfica.
Continuar »

martes, 22 de mayo de 2012

Se presentó el libro "Debian Administrator Handbook"

Hace pocos días se presentó y está disponible para la compra o la descarga el libro "Debian Administrator Handbook", de dos desarrolladores Debian, Raphaël Hertzog y Roland Mas. El libro se ofrece en diversos formatos: papel, o formatos de e-book: epub, pdf. La descarga es gratuita pero se puede donar dinero para apoyar el proyecto.



El libro de Hertzog y Mas comenzó como una traducción de su best-seller en francés, "Cahier de l'Admin Debian", ahora disponible también en inglés.

El proyecto fue financiado en principio apelando al mecanismo de crowdfounding.

Más informaciones en el site oficial:

http://debian-handbook.info/

Continuar »

jueves, 15 de marzo de 2012

Cómo extraer ("ripper" o rip) audio de YouTube

YouTube, entre otros servicios de flujos de video a demanda, se han constituido en un archivo audiovisual de la Humanidad.
En sites como YouTube hay mucho material cuyo audio es de buena calidad, por ejemplo de emisiones televisivas, en algunos casos incluso audiciones o presentaciones históricas.

Para los que preferimos archivarnos el audio y poder escucharlo donde sea, en casa, en el vieje en subte, en el auto resulta muy práctico transformar el flujo de video flv en un archivo de audio ogg o en su defecto mp3.
Sigue aquí un paso a paso o, para los apurados, una línea de consola que hará todo el trabajo.


El programa que encontré más rápido y directo es clive, que permite descargar videos de YouTube desde la consola.
Manos a la obra:

aptitude install clive

Hay que verificar que la versión de clive sea más o menos actual. En Debian Squeeze actualizado la versión probada es:

$ dpkg -l | grep clive
ii clive 2.2.13-5+squeeze4 video extraction utility for YouTube, Google Video and others
ii clive-utils 2.1.6-1 additional utilities for clive


clive son una serie de scripts Perl que permiten extraer un archivo flv desde YouTube. Tan simple como esto:

$ clive -f best URLDELVIDEO

Obs.: Con la opción -f best clive intentará obtener el video de mejor calidad disponible. Asombroso.

Y en el directorio de trabajo obtendremos el archivo URLDELVIDEO.flv

Finalmente se puede convertir el video flv a audio con ffmpeg

ffmpeg -i VIDEO.flv nombrearchivo.mp3

Ahora bien, de leyendo de la página de manual de clive pude obtener algunos parámetros interesantes. Para los que están apurados sigue la forma de hacer todo el trabajo en una sola línea de consola, lo que llaman un "oneliner":

Oneliner para extraer el audio en ogg:
clive --exec="ffmpeg -vn -i %i -acodec libvorbis %i.ogg;" -e -f best http://URLDELVIDEO

-vn producirá que no se extraiga el video.
-f best indica a clive tratar de obtener el stream de mejor calidad

Oneliner para extraer MP3 de la mejor calidad disponible:
clive --exec="ffmpeg -i %i %i.mp3;" -e -f best http://URLDELVIDEO

Si acaso no nos gusta el formato flv, también podremos convertir el video y guardar el video podemos hacerlo en ogg:

clive --exec="ffmpeg -i %i -acodec libvorbis %i.ogg;" -e -f best http://URLDELVIDEOENYOUTUBE

Continuar »

jueves, 8 de marzo de 2012

Finalmente ¿Cómo escuchar Vorterix desde la consola?

Actualización: ver este artículo:
Luego de algunos cambios en la forma que difunden su stream de audio vorterix parece haberse decidido por el uso de octoshape www.octoshape.com. La buena noticia es que, si bien no es un estándar abierto, ni mucho menos open source, el fabricante brinda soporte para Linux/GNU. Brevemente, para los que quieran escuchar esa radio sin "malgastar" recursos en el navegador con incrustaciones de flash y todos esos "accesorios".

Obs.: Ver actualización más reciente de este post:

Hoy lunes 12 introdujeron otra modificación en el site. Siguen, los pasos con los enlaces actualizados que se necesitan para poder escuchar la radio:

Soft requerido: mplayer o en su defecto vlc. Unzip se requiere para la instalación inicial.

1) Descargar el soft desde el site del fabricante:
2) Con el mismo usuario del sistema que se usará para oír el streaming dar permisos de ejecución y se descomprimirán los programas.
$ chmod u+x octosetup-linux_i386.bin
3) Se creará un directorio llamado octoshape. Desde allí ejecutando OctoshapeClient de la siguiente forma podremos iniciar el stream de Vorterix:
./OctoshapeClient -url:octoshape://streams.octoshape.net/sion/live/audio_2_64k

Se iniciará un proceso de mplayer que conectará a 127.0.0.1:6498, el socket que abre octoshape.
Por suerte esta vez, el fabricante brinda buen soporte para Linux/GNU, aún siendo un soft propietario y cerrado.


Obs.: Otro requerimiento que encontré es que en redes que utilicen proxy, por si acaso conviene anular el proxy en el shell que corra octoshape, de esta forma:

export http_proxy=""

O bien:

unset http_proxy




El motivo de esto es que Octoshape abre un socket en localhost:6498. Deshabilitar la variable del entorno http_proxy evitará que la conexión del programa cliente (mplayer o vlc) acaso intente conectar vía Internet.
Continuar »