用于处理来自runeberg(runeberg.org)的作品的库。
runeberg的Python项目详细描述
运行程序
一个库和命令行应用程序,用于从 Projekt Runeberg。
安装
您可以从PyPI:
安装runebergpip install runeberg
它在Python3.6及更高版本上受支持。
用作命令行应用程序
安装runeberg
后,只需调用程序即可获得
要下载,请按照提示下载(并解压缩)文件。
$ runeberg 1. "Det Ringer!" Skämt i en akt (1902) by Helena Nyblom [sv]2. "Då sa' kungen..." : Kungliga anekdoter under hundra år (1946) by ? [sv]3. "Pastoralier" (1899) by August Olsson [sv]4. "The Ripper" (uppskäraren) (1892) by Adolf Paul [sv]5. 100 Præstehistorier eller Præstestandens lyse og mørke Sider (1893) by Nils Poulsen [no]6. 14 Descriptive Pieces for the Young for Piano (1895) by Sveinbjörn Sveinbjörnsson [en]7. 14 sovjetryska berättare : valda och översatta från ryskan (1929) by ? [sv]8. 16 år med Roald Amundsen. Fra Pol til Pol (1930) by Oscar Wisting [no]9. 1720, 1772, 1809 (1836) by Magnus Crusenstolpe [sv]…What do you want to do? [1–25] to download, [N]ext 25, [Q]uit: █
使用-a
标志以作者列表开头,其中
将展示作品:
$ runeberg -a 1. Ülev Aaloe (1944) [ee]2. Simon Aberstén (1865–1937) [se]3. Selma Abrahamsson (1872–1911) [fi]4. Arthur Dyke Acland (1847–1926) [uk]5. Adam Bremensis (1044–1080) [de]6. Gertrud Adelborg (1853–1942) [se]7. Ottilia Adelborg (1855–1936) [se]8. Gudmund Jöran Adlerbeth (1751–1818) [se]9. Gustav Magnus Adlercreutz (1775–1845) [se]…What do you want to do? [1–25] to display their works, [N]ext 25, [Q]uit: 6Displaying works by Gertrud Adelborg [uid=adelbger]…1. Några drag af de till Danmark utvandrade allmogeflickornas ställning och arbetsförhållanden (1890) by Gertrud Adelborg [sv]2. Några upplysningar angående de svenska allmogeflickornas utvandring till Danmark (1893) by Gertrud Adelborg [sv]What do you want to do? [1–2] to download, [Q]uit: █
使用-h
标志查看选项和筛选器的完整列表。
用作库
首先确定要下载的工作的标识符。例如
http://runeberg.org/aldrigilif/这个<uid>
就是aldrigilif
。
# Download and unpack a work from runeberg.org:# this will by default download the work to /downloaded_data/<uid>/importruneberg.downloadasdownloaderdownloader.get_work('<uid>')# Warning raised if additional colour images are found, these are not unpacked.# Parse the downloaded work:# from the parsed work you can access individual pages, articles/chapters along# with any metadataimportrunebergparsed_work=runeberg.Work.from_files('<uid>')# Create a DjVu file of the workprint(parsed_work.to_djvu())# outputs the path to the created file
注意事项
有些Metadata
文件是用Windows 1252
编码的,而不是
默认值latin-1
。框架当前未检测到此问题。如果你
遇到这样的文件有些字符可能会被误解,您必须
在分析工作之前手动重新编码文件。
如果最初扫描的图像是.jpg
,则下载的“颜色
“图片”将只是这些的第二个相同的副本。
要求
对于DJVU转换,必须安装DjVuLibre
。
更改日志
0.0.2
- [中断]将
Page
的prpoerty重命名为text
。 - 向
Work
和Article
引入text
属性。 - 重新使用先前运行生成的djvu文件。添加
force
参数以避免重用。 - 分析
IMAGE_SOURCE
元数据。 - 将测试扩展到PY37、PY38
0.0.1
- 初始PYPI发布。