Mobileread
Weiterentwicklung von Ebola
#1  mcdummy 02-12-2018, 04:58 AM
Hallo,

wollte nur mal kurz fragen, ob jemand Lust hat sich an der Weiterentwicklung von Ebola zu beteiligen?

Der Autor von Ebola hätte nichts dagegen, wenn das Programm von anderen weiterentwickelt und ein GitHub oder dergleichen eingerichtet wird.

Ich selbst habe bereits ein paar Änderungen in meinem Code und an den Style-Files gemacht, hab aber nur Grundkenntnisse in der Pascal-Programmierung.

McDummy
Reply 

#2  Doitsu 02-13-2018, 07:13 AM
Quote mcdummy
Ich selbst habe bereits ein paar Änderungen in meinem Code und an den Style-Files gemacht, hab aber nur Grundkenntnisse in der Pascal-Programmierung.
Ich habe keine Ahnung von Pascal, aber es dürfte relativ einfach sein, einen Ebola-Klon mit Python als Sigil-Plugin zu schreiben, weil Sigil eine eigene Version des HTML-Parsers Beautiful Soup hat, mit dem man sehr leicht Text aus Websites extrahieren kann.
Ich benutze übrigens die Website epub2go, die für meine Zwecke völlig ausreichend ist.
Reply 

#3  doubleshuffle 02-13-2018, 03:39 PM
Blöde Frage: Was ist Ebola? Kann ich aus Doitsus Antwort schließen, dass es um die Epubifizierung von Gutenberg-DE-Büchern geht?
Reply 

#4  Doitsu 02-13-2018, 04:21 PM
Quote doubleshuffle
Blöde Frage: Was ist Ebola?
Ein Programm für die automatische Erstellung von Gutenberg DE epubs. Hier ist die Website.
Reply 

#5  doubleshuffle 02-13-2018, 04:52 PM
Danke. Das klappt aber mit epub2go doch wirklich ganz gut. Aber natürlich ist man da abhängig davon, dass die Website weiter besteht. Insofern wäre ein Sigil-Plugin schon eine schicke Sache, aber nichts, wofür jemand irrsinnig viel Zeit aufwenden sollte.
Reply 

#6  mcdummy 02-14-2018, 02:32 AM
Habe epub2go auch schon ausprobiert. Hat den Vorteil, dass die Fußnoten aus dem Text extrahiert und ans Ende der Seite gestellt werden.

Der große Nachteil von epub2go ist, dass fast alle Style-Klassen im Text gelöscht werden. Ebola lässt die drinnen. Wenn man sich das aktuelle Style-File von Gutenberg-Spiegel besorgt und ein bisschen modifiziert, hat das endgültige EBook das Aussehen von der Web-Seite.

Gemeinsam haben beide das Problem, dass Verlinkungen innerhalb des Textes (z.B. Verweise auf frühere Kapitel) nicht aufgelöst werden. Zum Teil werden die dazugehörenden Sprungmarken (z.B. id="...") gelöscht.

Bei Ebola finde ich auch praktisch, dass man Bücher sowohl von Gutenberg als auch von Zeno herunterladen kann ohne dass man die genaue Webadresse kennen muss.
Reply 

#7  Doitsu 02-14-2018, 05:44 AM
Quote doubleshuffle
Insofern wäre ein Sigil-Plugin schon eine schicke Sache, aber nichts, wofür jemand irrsinnig viel Zeit aufwenden sollte.
Für mich reicht epub2go völlig aus. Sollte die Website jemals offline gehen, würde ich ernsthaft über ein Sigil-Plugin nachdenken.

Quote mcdummy
Der große Nachteil von epub2go ist, dass fast alle Style-Klassen im Text gelöscht werden.
Das würde ich eher als Vorteil sehen, weil ich ohnehin meist meine eigenen Styles verwende.

Quote mcdummy
Gemeinsam haben beide das Problem, dass Verlinkungen innerhalb des Textes (z.B. Verweise auf frühere Kapitel) nicht aufgelöst werden. Zum Teil werden die dazugehörenden Sprungmarken (z.B. id="...") gelöscht.
Das ist mir bis jetzt noch nicht aufgefallen. Hast Du die Betreiber von epub2go schon über dieses Problem informiert?
Reply 

#8  mcdummy 02-14-2018, 06:07 AM
Das mit dem Löschen der Style-Files finde ich schon unpraktisch, da damit Informationen über ursprünglich unterschiedliche Formatierungen verloren gehen.

Die einzelnen Klassen lassen sich nach Bedarf ja immer noch abändern. Bei Ebola habe ich mir z.B. eine eigene (modifizierte) Style-Datei in ein Vorlagenverzeichnis kopiert. Die wird dann immer in die EBooks von Gutenberg eingebaut.

Die Betreiber von epub2go habe ich noch nicht kontaktiert. Ich bin nicht so ein Fan davon, dass man von einer Internet-Seite abhängt.

Die fehlende Verlinkung innerhalb des Textes tritt oft bei philosophischen Werken auf. Ach haben einige Bücher ein Inhaltsverzeichnis auf der ersten Seite. Das wird auf spiegel.de nicht angezeigt, da es per style auf non-display gesetzt ist.
Reply 

#9  doubleshuffle 02-14-2018, 06:34 AM
Quote Doitsu
Für mich reicht epub2go völlig aus. Sollte die Website jemals offline gehen, würde ich ernsthaft über ein Sigil-Plugin nachdenken.
Genau; das reicht ja dann auch noch (und wäre dann natürlich ein großer Dienst an der lesenden Menschheit).
Reply 

#10  Doitsu 09-09-2018, 06:28 AM
Da epub2go häufig ungültige Epub-Dateien erstellt, habe ich ein eigenes Plugin erstellt, das versucht, gültige Epub-Dateien zu erstellen, indem es nicht unterstützte Tags und Attribute, soweit möglich, in andere Tags und/oder Inline-Styles zu ändern. Zum Beispiel ändert es:

Code
<tt lang="it">La finta semplice</tt>
in

Code
<span lang="it" style="font-family: monospace;">La finta semplice</span>
Das Plugin erfordert mindestens Sigil 0.9.8.

Da ich es hauptsächlich für den Eigenbedarf geschrieben habe, hat es keine Benutzeroberfläche. Um es zu verwenden, muss man in Sigil eine leere epub2/epub3-Datei erstellen, bei Gutenberg DE die URL des ersten Kapitels in die Zwischenablage kopieren und dann das Plugin ausführen.

Das Plugin schreibt dann die Kapitel in die epub2/epub3-Datei. Standardmäßig generiert es auch die erforderlichen Informationen, um eingebettete Druckseitenzahlen anzuzeigen, soweit vorhanden.

Wenn man eine (epub2-kompatible) epub3-Datei erstellt, kann man sich Druckseitenzahlen u.a. in iBooks und Azardi Reader anzeigen lassen. (Druckseitenzahlen sind allerdings in beiden Programmen standardmäßig deaktiviert. In der iOS-Version von iBooks muss man auf "Tap to show printed page numbers" tippen und bei Azardi Reader auf das Druckersymbol klicken.)

Einstellungen:

Man kann die folgenden Einstellungen durch das Ändern von Einträgen in \sigil-ebook\sigil\plugins_prefs\DeGutenberg\DeGutenberg. json ändern:

Code
{ "kindle": false, "endnotes": false, "tt_style": "font-family: monospace;"
}
Wenn man "kindle": false, in "kindle": true, ändert, werden einige CSS-Selektoren auskommentiert, die KindleGen nicht unterstützt. Außerdem werden in Seitenmarkierungen die sichtbaren Seitennummern gelöscht.
Diese Änderungen sind erforderlich, weil Kindle Previewer/KindleGen und das darauf basierende KFX-Output-Plugin sonst die Fehlermeldungen Error(core):E1003 und Error(parsing):E3013 ausgibt.

Wenn man "endnotes": false, in "endnotes": true, ändert, werden Fußnoten in eine eigene Datei am Ende des Buchs geschrieben. (Ansonsten werden sie am Ende des Kapitels eingefügt.)

Wenn man "tt_style": "font-family: monospace;" in "tt_style": "font-style: italic;" ändert, werden im Original von <tt></tt> eingeschlossene Textstellen kursiv dargestellt. (Als Wert können alle gültigen Inline-Styles verwendet werden.)

Bekannte Probleme:

Da Inhaltsverzeichniseinträge nicht einheitlich markiert wurden, enthält das vom Plugin erzeugte Inhaltsverzeichnis oft falsche Einträge, die man durch Neuerstellen des Inhaltsverzeichnisses korrigieren kann.
Dabei ist zu beachten, dass Sigil bei epub2-Dateien bei der Neuerstellung des logischen Inhaltsverzeichnisses (toc.ncx) den Pagelist-Abschnitt ohne Vorwarnung löscht. Das ist aber kein Problem, sofern man die epub2-Datei nicht mit dem Calibre-KFX-Output-Plugin konvertieren möchte.
In epub3-Dateien wird der Pagelist-Abschnitt bei einer Aktualisierung des logischen Inhaltsverzeichnisses nicht gelöscht, man muss aber manuell Tools > Epub 3 Tools > Generate NCX from Nav wählen, um toc.ncx zu aktualisieren.
[zip] DeGutenberg_v0.1.2.zip (16.2 KB, 12 views)
Reply 

  Next »  Last »  (1/2)
Today's Posts | Search this Thread | Login | Register