Mobileread
Tolino Tolino - Deutsche Silbentrennung
#1  Moonbase59 11-25-2021, 05:29 PM
Die Tolinos sind zwar schöne Geräte, die mitgelieferte Silbentrennung verdirbt aber – zuminest mir – ziemlich den Lesespaß. Zu diesem Thema gab es schon mehrere Ansätze, z.B. Peripathetics Customizing the Tolino und Sentos Silbentrennung verbessern (PocketBook), aber keine konnte mich so recht zufriendenstellen.

Ich habe mir darum die aktuelle (2021-11-25) Version der TeX-Silbentrennung dehyph-exptl des dante e.V. (MIT-lizenziert) als Basis genommen, die Wortlisten (Korpusgröße > 500.000 Wörter) und Regeln weiter ausgebaut, neu kompiliert, in LaTeX getestet und dann in die Formate für Hunspell (Hyphen) und Hyphenator konvertiert und weiter für den Tolino angepasst.

Herausgekommen ist eine, wie ich finde, für algorithmische silbenbasierte Trennung ganz brauchbare Version – in jedem Fall deutlich besser als das, mit dem die Tolino-Allianz uns "verwöhnt".

Die Tolinos verwenden ein – üblicherweise automatisch umgeschaltetes – Konglomerat von Reader Engines, bestehend aus dem Adobe RMSDK, Readium und Lites ("Tolino-Leseerfahrung Beta") und eine Menge veralteter Open-Source-Software wie z.B. Hunspell- (Hyphen-)kompatible Silbentrennungsbibliotheken ("hyph_de.dic") und das Hyphenator-Javascript mit "de.js".

Ganz klar ist mir nicht, ob und wann der Hyphenator tatsächlich verwendet wird, mit Readium bzw. Lites als Engine konnte ich keine Silbentrennung beobachten. Das scheint lediglich mit dem Adobe RMSDK und der "hyph_de.dic" gut zu funktionieren. Weiß hier evtl. jemand Genaueres?

Sicherheitshalber habe ich jedenfalls auch neue Patterns für den Hyphenator erzeugt. Als Testgerät benutze ich einen Tolino Vision 5 mit Softwarestand 14.2.0.

Die veraltete Software im Tolino erlaubt leider nicht die modernen Compound- und NOHYPHEN-Funktionen in "hyph_de.dic" (wie sie etwa Sento für das PocketBook benutzt), daher musste ich einige "Verrenkungen" einbauen, damit es halbwegs gut funktioniert. Die im Tolino eingesetzte Adobe-Engine erlaubt augenscheinlich nur die Verwendung des Level 2, was die Möglichkeiten stark einschränkt.

Die "Zwei-Buchstaben-Silbentrennung" wie etwa in "Be-darf" oder "Allgäu-er" habe ich drastisch reduziert, da sie den Lesefluss eher hemmt und zu deutlich mehr Trennstellen führt. Ich finde, eine Silbentrennung ab drei Zeichen Länge ist für den Blocksatz noch vertretbar, zumal aus unerfindlichen Gründen Absätze mit Erstzeileneinzug sowieso nicht getrennt werden (warum?).

Tipp: Ein wahlloses Ändern der Parameter …HYPHENMIN in "hyph_de.dic" bzw. leftmin und rightmin in "de.js" bringt nicht viel. Die zugrundeliegenden Silbentrennungsmuster müssten für jeden Fall neu berechnet werden. Eine Anpassung nach unten (z.B. auf 2/2) würde gar nicht funktionieren, da die "kurzen" Muster nicht mehr in den Tabellen enthalten sind.

Der verwendete Korpus und die errechneten Silbentrennmuster sind m.E. recht gut – hier noch einmal ein herzliches Dankeschön an die "Trennmustler" des dante e.V.! –, aber es gibt natürlich keine vollumfängliche Lösung. Sprache lebt! Einige Grenzfälle und falsche Trennungen bei Eigen- und Ortsnamen sind immer möglich. Aus Performancegründen wird auch eine Reihe einheitlicher Präfixe und Suffixe verwendet, sodass nicht immer die vom Duden empfohlene Trennung erfolgen wird, aber (hoffentlich) immer eine zulässige.

Lasst mich wissen, wie euch diese Variante der Silbentrennung gefällt und meldet bitte auch Fehler.

Installation

1. Angehängtes Archiv entpacken. Es enthält die Dateien "hyph_de.dic" und "de.js".

2. Tolino über USB mit dem PC verbinden und ein Backup der vorhandenen Dateien ".tolino/hyphenator/patterns/de.js" und ".tolino/hyphenDicts/hyph_de.dic" anfertigen (oder diese umbenennen). Achtung: Der Ordner ".tolino" (MIT führendem Punkt!) ist (zumindest für Android und Linux) unsichtbar, ihr müsst also zuerst die Anzeige unsichtbarer Dateien und Ordner aktivieren (im Linux-Dateimanager üblicherweise mit Strg+H).

3. Datei "de.js" aus dem Archiv kopieren nach ".tolino/hyphenator/patterns/de.js". Anschließend unbedingt schreibschützen ("read-only machen"), da der Tolino sie sonst bei jedem Neustart wieder durch seine eigene schlechte Version ersetzt! Im Linux-Dateimanager dazu Rechtsklick → Eigenschaften → Zugriffsrechte, dann für Eigentümer/Gruppe/Welt jeweils "Nur lesen" einstellen.

4. Datei "hyph_de.dic" aus dem Archiv kopieren nach ".tolino/hyphenDicts/hyph_de.dic". Anschließend unbedingt schreibschützen ("read-only machen"), da der Tolino sie sonst bei jedem Neustart wieder durch seine eigene schlechte Version ersetzt! Im Linux-Dateimanager dazu Rechtsklick → Eigenschaften → Zugriffsrechte, dann für Eigentümer/Gruppe/Welt jeweils "Nur lesen" einstellen.

5. Tolino "auswerfen" (vom USB-Gerät trennen mittels Betriebssystem-Funktion) – nicht einfach Kabel ziehen!

6. Abwarten, bis der Tolino nach neuen Büchern gesucht hat, dann neu starten. Beim Shine und Vision 5 geschieht das durch längeres Drücken der Power-Taste. Es erscheint dann ein Menü, auf dem man "Ausschalten" bzw. "Neu starten" wählen kann. "Neu starten" reicht an dieser Stelle.

7. Zur Kontrolle ggf. den Tolino noch einmal mit dem PC verbinden und überprüfen, ob die beiden kopierten Dateien noch vorhanden sind (Größe/Datum) oder vom Tolino durch seine Version ersetzt wurden.

8. Deutsches E-Book im EPUB-Format öffnen und funktionierende Silbentrennung überprüfen. Achtung: Die sehr umfangreichen deutschen Silbentrennungsmuster verzögern das Laden bzw. die Neuanzeige nach Schriftgrößenänderung um ein paar Sekunden, nicht erschrecken! Das anschließende – hoffentlich erfreuliche – Leseerlebnis sollte dafür entschädigen. Ob der Tolino fertig ist, erkennt man am Neuaufbau der Seite (es wird ja zuerst hohe Geschwindigkeit durch das Laden eines im Cache gespeicherten Screenshots vorgegaukelt …) oder daran, dass er auf ein Antippen in der Displaymitte mit der Anzeige der Menüs reagiert.

Viel Freude und Lesespaß damit!
[zip] tolino-hyph_de.zip (236.4 KB, 253 views)
Reply 

#2  rantanplan 11-26-2021, 03:55 AM
Wirkt sich die verbesserte Silbentrennung auch auf die Skoobe App (die offizielle, nicht die via Sideload) aus?
Reply 

#3  Moonbase59 11-26-2021, 08:03 AM
Gute Frage, probier’ es doch mal aus! ;-) Soweit ich das verstehe, funktioniert Skoobe über Thalia online und per Ausleihe, oder? Es scheint so, als ob dazu die eingebaute Reader-Engine benutzt wird, ich habe aber kein Thalia- und kein Skoobe-Konto, kann das also nicht testen.

Prinzipiell sollte es für alle EPUBs funktionieren, die über die Tolino-App mit der Adobe-Engine gelesen werden (RMSDK) und den Sprachcode "Deutsch" enthalten.
Reply 

#4  rantanplan 11-27-2021, 03:14 AM
Ich bin mir nicht sicher wie es funktioniert, weil es irgendwie so gar nicht in das normale Leseerlebnis integriert ist. Ich werde es nachher mal ausprobieren.
Reply 

#5  Moonbase59 11-27-2021, 06:37 AM
Super, freu’ mich auf dein Feedback!
Reply 

#6  rantanplan 11-29-2021, 05:20 AM
Nur das du dich nicht wunderst, ich stehe gerade vor der Herausforderung, dass ich ein Macbook benutze und ich mir zwar via openMTP den Inhalt des Gerätes anschauen kann, aber openMTP (soweit ich sehen kann) versteckte Dateien nicht anzeigt. Damit komme ich im Moment nicht in den .tolino Ordner.

EDIT
War nur zu blind die Option zu finden. Leider kann ich via openMTP die Schreibrechte nicht setzen.
Reply 

#7  Moonbase59 11-29-2021, 06:56 AM
Hm. MTP war die dämlichste Erfindung ever für Android … Hab ich aber auf meinem Handy auch. Vielleicht kannst du ja auf’m Mac in dem Ordner ein Terminal aufmachen und einfach sowas wie "chmod -w hyph_de.dic" machen? Oder auch "chmod 444 hyph_de.dic". (Vorher ggf. mit "ls -la" mal gucken, wie sie stehen. Und danch nochmal prüfen.)

Ach ja, vielleicht ist es auf’m Mac mit MTP auch so wie unter Linux: Nur einer kann das gleichzeitig benutzen. Also nicht mehrere Dateimanager oder Calibre gleichzeitig darauf gucken lassen. Ich lass’ immer mein Calibre aus, verbinde das Teil über USB und mach dann "die Arbeit" über einen Dateimanager oder über das Terminal. Habe leider keinen Mac hier zum Testen.

Und natürlich: "Auswerfen" vorm Abstecken nicht vergessen. Dafür gibt’s auf ’nem Mac bestimmt auch ’ne Betriebssystem-Funktion.

Insoweit wäre es natürlich für Mac-Benutzer auch spannend, ob – und wie – du das hinbekommst! Danke schonmal für’s Testen!
Reply 

#8  CaDip 01-21-2022, 02:12 PM
Lieber Moonbase59,

herzlichen Dank für die Datei und die Anleitung!

Regelmäßig bin ich bisher ausgerastet, weil der Tolino nicht einfach nur katastrophal falsch trennt (das lässt sich in wenigen Einzelfällen auch bei guten Layout-Programmen nicht verhindern, das weiß ich), sondern sogar einzelne Konsonanten auf die nächste Zeile schiebt. Immer dachte ich, dass es doch nicht so schwer sein könne, einem Programm zu sagen, dass eine abgetrennte Silbe mal mindestens einen Vokal beinhalten muss. Unfassbar, dass die Telekomiker an einem funktionstüchtigen Programm kein Interesse haben oder unfähig sind, eines zu schreiben. – Aber was rege ich mich auf, jetzt funktioniert es ja (auch wenn ich bisher nur Stichproben gemacht habe). Kurz, ich habe mich extra hier angemeldet, um Ihnen zu sagen:

Vielen Dank!
Carlo D.
Reply 

Today's Posts | Search this Thread | Login | Register