用于处理来自runeberg(runeberg.org)的作品的库。

runeberg的Python项目详细描述


运行程序Build Statuscodecov.io Code Coverage

一个库和命令行应用程序,用于从 Projekt Runeberg

安装

您可以从PyPI

安装runeberg
pip install runeberg

它在Python3.6及更高版本上受支持。

用作命令行应用程序

安装runeberg后,只需调用程序即可获得 要下载,请按照提示下载(并解压缩)文件。

$ runeberg
1. "Det Ringer!" Skämt i en akt (1902) by Helena Nyblom [sv]2. "Då sa' kungen..." : Kungliga anekdoter under hundra år (1946) by ? [sv]3. "Pastoralier" (1899) by August Olsson [sv]4. "The Ripper" (uppskäraren) (1892) by Adolf Paul [sv]5. 100 Præstehistorier eller Præstestandens lyse og mørke Sider (1893) by Nils Poulsen [no]6. 14 Descriptive Pieces for the Young for Piano (1895) by Sveinbjörn Sveinbjörnsson [en]7. 14 sovjetryska berättare : valda och översatta från ryskan (1929) by ? [sv]8. 16 år med Roald Amundsen. Fra Pol til Pol (1930) by Oscar Wisting [no]9. 1720, 1772, 1809 (1836) by Magnus Crusenstolpe [sv]What do you want to do? [1–25] to download, [N]ext 25, [Q]uit: █

使用-a标志以作者列表开头,其中 将展示作品:

$ runeberg -a
1. Ülev Aaloe (1944) [ee]2. Simon Aberstén (1865–1937) [se]3. Selma Abrahamsson (1872–1911) [fi]4. Arthur Dyke Acland (1847–1926) [uk]5. Adam Bremensis (1044–1080) [de]6. Gertrud Adelborg (1853–1942) [se]7. Ottilia Adelborg (1855–1936) [se]8. Gudmund Jöran Adlerbeth (1751–1818) [se]9. Gustav Magnus Adlercreutz (1775–1845) [se]What do you want to do? [1–25] to display their works, [N]ext 25, [Q]uit: 6Displaying works by Gertrud Adelborg [uid=adelbger]…1. Några drag af de till Danmark utvandrade allmogeflickornas ställning och arbetsförhållanden (1890) by Gertrud Adelborg [sv]2. Några upplysningar angående de svenska allmogeflickornas utvandring till Danmark (1893) by Gertrud Adelborg [sv]What do you want to do? [1–2] to download, [Q]uit: █

使用-h标志查看选项和筛选器的完整列表。

用作库

首先确定要下载的工作的标识符。例如 http://runeberg.org/aldrigilif/这个<uid>就是aldrigilif

# Download and unpack a work from runeberg.org:# this will by default download the work to /downloaded_data/<uid>/importruneberg.downloadasdownloaderdownloader.get_work('<uid>')# Warning raised if additional colour images are found, these are not unpacked.# Parse the downloaded work:# from the parsed work you can access individual pages, articles/chapters along# with any metadataimportrunebergparsed_work=runeberg.Work.from_files('<uid>')# Create a DjVu file of the workprint(parsed_work.to_djvu())# outputs the path to the created file

注意事项

有些Metadata文件是用Windows 1252编码的,而不是 默认值latin-1。框架当前未检测到此问题。如果你 遇到这样的文件有些字符可能会被误解,您必须 在分析工作之前手动重新编码文件。

如果最初扫描的图像是.jpg,则下载的“颜色 “图片”将只是这些的第二个相同的副本。

要求

对于DJVU转换,必须安装DjVuLibre

更改日志

0.0.2

  • [中断]将Page的prpoerty重命名为text
  • WorkArticle引入text属性。
  • 重新使用先前运行生成的djvu文件。添加force参数以避免重用。
  • 分析IMAGE_SOURCE元数据。
  • 将测试扩展到PY37、PY38

0.0.1

  • 初始PYPI发布。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Spring数据JPA+Hibernate在不首先找到父实体的情况下保存子实体   php Java:如何从CLI接收命令   spring为java中的导出数据创建访问文件   java在Windows 8.1上安装Play Framework   java Spring启动白标签错误页面(类型=未找到,状态=404)   java如何在单击时从数组中绘制?   java fn:substringAfter()上次出现   java在IFR语句中使用方法返回   java onPause()或onStop()的名称   对关联对象的关联对象具有条件的java HQL查询   java只打印一次总值,无需迭代   java如何使用抽象Uri buildOn()方法?   如何在Java中执行sudo命令并获得错误输出?   java反射:避免对getConstructor(类<?>…)的未经检查的警告调用作为原始类型类的成员   Java:如何从类中创建的对象调用类方法?   java如何在电子邮件中嵌入图像?   java如何在Android上启用详细GC?   java什么是串行版本id?