Automatización del proceso de transformación de formatos de publicaciones en revistas científicas a través de script en Phyton
Abstract
La divulgación y difusión científica es el medio para que la sociedad y otros científicos sean conscientes de los resultados de la investigación y la generación de nuevos conocimientos. En los últimos años, las revistas científicas en formato digital se han convertido en el medio más utilizado para mostrar estos resultados, pero es necesario considerar si vamos a publicar o consultar una revista para analizar algunos aspectos de ellas, como su presentación, forma de distribución, calidad de su contenido e impacto de la revista. Aunque todos estos elementos son de interés, la forma de distribución es de gran relevancia, ya que está vinculada a la visibilidad de la revista; si no se encuentra, no se lee ni se cita. Sin embargo, sin formatos de publicación diversos, no podremos mejorar el alcance digital de quienes utilizan este contenido. Según datos del informe de Scholastica, una plataforma web de pago que incluye a más de 900 editores de revistas académicas, los formatos más utilizados son pdf y html.
En algunos estudios realizados en América Central, específicamente en Costa Rica y Panamá, los formatos de revistas científicas utilizados son pdf, html, ePub, xml-jats, audio y Flipbook. De las 185 revistas evaluadas, solo el 50% utiliza dos formatos y apenas el 15% utiliza más de tres formatos, siendo html y pdf los más comunes. Sin embargo, la limitación no es solo el uso de software como MS Word para transformar pdf a html debido a las limitaciones, sino que, según los editores, no utilizan otros formatos porque desconocen el software utilizado para este proceso.
En el caso de las revistas panameñas, de 30 revistas evaluadas, el 100% utilizaba pdf, solo seis utilizaban html y solo cuatro revistas usaban más de tres formatos, por lo que podemos decir que existe una deficiencia en la cantidad de formatos y, probablemente, en el tiempo que el proceso de transformación pueda llevar a los editores.
El objetivo de este trabajo es generar un script utilizando Python como lenguaje de programación para automatizar el proceso de transformación de formatos de artículos científicos en docx a otros formatos como pdf, html, ePub, txt y audio, minimizando el uso de software y reduciendo el tiempo de procesamiento de estos documentos. En las pruebas realizadas con el script, fue necesario generar formatos de estilo de caracteres para lograr buenos resultados, donde no solo fue posible transformar 24 artículos de dos revistas panameñas en los cinco formatos, sino que el tiempo de transformación fue de 15 minutos en comparación con las 15 horas que llevó a los editores realizar esta transformación.
En algunos estudios realizados en América Central, específicamente en Costa Rica y Panamá, los formatos de revistas científicas utilizados son pdf, html, ePub, xml-jats, audio y Flipbook. De las 185 revistas evaluadas, solo el 50% utiliza dos formatos y apenas el 15% utiliza más de tres formatos, siendo html y pdf los más comunes. Sin embargo, la limitación no es solo el uso de software como MS Word para transformar pdf a html debido a las limitaciones, sino que, según los editores, no utilizan otros formatos porque desconocen el software utilizado para este proceso.
En el caso de las revistas panameñas, de 30 revistas evaluadas, el 100% utilizaba pdf, solo seis utilizaban html y solo cuatro revistas usaban más de tres formatos, por lo que podemos decir que existe una deficiencia en la cantidad de formatos y, probablemente, en el tiempo que el proceso de transformación pueda llevar a los editores.
El objetivo de este trabajo es generar un script utilizando Python como lenguaje de programación para automatizar el proceso de transformación de formatos de artículos científicos en docx a otros formatos como pdf, html, ePub, txt y audio, minimizando el uso de software y reduciendo el tiempo de procesamiento de estos documentos. En las pruebas realizadas con el script, fue necesario generar formatos de estilo de caracteres para lograr buenos resultados, donde no solo fue posible transformar 24 artículos de dos revistas panameñas en los cinco formatos, sino que el tiempo de transformación fue de 15 minutos en comparación con las 15 horas que llevó a los editores realizar esta transformación.