Mobileread
PDF in Mobi umwandeln
#1  Nordlicht 04-08-2009, 03:05 PM
Hallo,

ich habe einige eBooks im PDF-Format im Bestand. Diese würde ich zwecks besserer Lesbarkeit ins Mobi-Format umwandeln.

Macht es Sinn, diese mit calibre direkt zu konvertieren ? Oder ist es besser, die erst in ein Textformat zu wandeln und dann weiter ins Mobi-Format...

Viele Grüße

Nordlicht
Reply 

#2  mtravellerh 04-08-2009, 03:36 PM
Quote Nordlicht
Hallo,

ich habe einige eBooks im PDF-Format im Bestand. Diese würde ich zwecks besserer Lesbarkeit ins Mobi-Format umwandeln.

Macht es Sinn, diese mit calibre direkt zu konvertieren ? Oder ist es besser, die erst in ein Textformat zu wandeln und dann weiter ins Mobi-Format...

Viele Grüße

Nordlicht
Auf jeden Fall vorher umwandeln
Reply 

#3  Nordlicht 04-08-2009, 04:06 PM
Quote mtravellerh
Auf jeden Fall vorher umwandeln
Ich habe es befürchtet
Reply 

#4  Nordlicht 04-09-2009, 04:09 PM
Hallo...

ich habe mich einmal testweise herangewagt. Das PDF wurde in rtf konvertiert und ein wenig nachbearbeitet.

Dann habe ich mit calibre (später auch mit MobiCreator) ins Mobi-Format konvertiert. In der fertigen Datei wurden teilweise Wörter mit "-" getrennt, die in der rtf-Datei nicht getrennt waren.

Wie stelle ich das ab ??

Viele Grüße

Nordlicht

PS: Habe eben gesehen, dass die OCR mir da ein Zeichen reinhaut, was dann wohl später als "-" interpretiert wird. Wie entfernt man sowas mit Bordmitteln ? Die rtf-Datei als html speichern hilft nicht
 
Reply 

#5  Pulp 04-09-2009, 07:01 PM
Am einfachstenentfernst Du es mit einem Editor, der reguläre Ausdrücke kennt.

Ein gutes, kostenloses Besipiel ist PSPad.
Dort öffnest Du suchen->ersetzen und machst je ein Häckchen bei Groß-/Kleinschreibung und bei Regular expressions.

Als Suchbegriff gibst du:
Code
\b(\w+)-([a-z]\w*)\b
ein, bei ersetzen:
Code
\1\2
Das behebt das Problem für die meisten Fälle, die anschliessende Durchsicht der verbleibenden "-" sollte schnell erledigt sein.
Reply 

#6  mtravellerh 04-10-2009, 02:20 AM
Quote Pulp
Am einfachstenentfernst Du es mit einem Editor, der reguläre Ausdrücke kennt.

Ein gutes, kostenloses Besipiel ist PSPad.
Dort öffnest Du suchen->ersetzen und machst je ein Häckchen bei Groß-/Kleinschreibung und bei Regular expressions.

Als Suchbegriff gibst du:
Code
\b(\w+)-([a-z]\w*)\b
ein, bei ersetzen:
Code
\1\2
Das behebt das Problem für die meisten Fälle, die anschliessende Durchsicht der verbleibenden "-" sollte schnell erledigt sein.
Pulp, ich erhebe Dich hiermit zum lokalen RegEx-Experten.
Reply 

#7  Pulp 04-10-2009, 05:49 AM
Reply 

Today's Posts | Search this Thread | Login | Register