Mobileread
Tolino Tolino-Wörterbücher – Aufruf zur Mithilfe
#1  Moonbase59 12-13-2021, 08:18 AM
Die Tolino-Wörterbücher basieren ja – wie bekannt sein dürfte – auf der Arbeit von Wiktionary und Reimar Döffingers ".quickdic"-Umsetzung (in Version 6).

Leider hat deren Qualität durch Umstrukturierungen und Erweiterungen der Wiktionaries in den letzten Jahren sehr gelitten – besonders in den Nachschlage-Wörterbüchern werden ja fast nur noch seitenweise Wiktionary-Codefragmente angezeigt (vgl. die angehängten Screenshots in meinem diesbezüglichen Issue).

Um diese Situation zu verbessern, starte ich hiermit einen Aufruf zur Mithilfe.

Links:
Reply 

#2  Doitsu 12-13-2021, 12:01 PM
Quote Moonbase59
Die Tolino-Wörterbücher basieren ja – wie bekannt sein dürfte – auf der Arbeit von Wiktionary und Reimar Döffingers ".quickdic"-Umsetzung (in Version 6).
Ich bin vor einigen Jahren auf die Wiktionary-Website von Matthias Buchmeier gestoßen, der aus dem englischen Wiktionary automatisch Wiktionary-Wortlisten für viele Sprachen generiert: Matthias Buchmeier - Bilingual Dictionaries for Offline Use

Der Download-Link ist hier. (Du müsstest die ding-Dateien herunterladen.)

Im ding-Textformat, sehen die Einträge zum Beispiel so aus:
Code
character {n} (being in a story) :: Figur {f}, Person {f}
character {n} (distinguishing feature) :: Charakter {m}
character {n} (moral strength) :: Charakter {m}
character {n} (notable or eccentric person) :: Original {n}
character {n} (symbol for a sound or a word) :: Buchstabe {m}, Zeichen {n}, Schriftzeichen {n}
character {n} ((computing) basic element in a text string) :: Character, Zeichen {n}
Wenn Du die ::-Zeichen (einschließlich der Leerzeichen davor und danach) durch Tabulatoren ersetzt, müssten sich die Textdateien laut diesem Beitrag als Eingabedateien verwenden lassen.

Allerdings ist die neueste Version von Döffingers Tool anscheinend nicht mehr mit Tolino kompatibel. Möglicherweise müsstest Du eine ältere Version herunterladen oder Döffinger fragen, ob es einen speziellen Befehl gibt, um Tolino-Wörterbücher zu generieren.

EDIT: Anscheinend gibt es noch einen Fork von Döffingers Tool, mit dem man aber anscheinend nur Deutsch->Englisch-Wörterbücher generieren kann:

Toligen


Wenn Du die Sprachcodes im Shell-Skript generate_chemnitz.sh änderst, müsstest Du damit auch die ding-Dateien von Matthias Buchmeier konvertieren können, weil die Chemnitz-Dateien auch im ding-Format vorliegen.
Reply 

#3  Moonbase59 12-14-2021, 06:14 AM
@Doitsu: Danke für die Info, Matthias Buchmeiers Seiten kannte ich tatsächlich noch nicht. Dass Chemnitz das "ding"-Format verwendet, ist auch eine hilfreiche Information.

Allerdings liegt mein Fokus auf einsprachigen Nachschlagewerken, wie man den Beiträgen vielleicht nicht deutlich genug entnimmt. Diese sind i.d.R. wesentlich umfangreicher und lassen sich nicht einfach mit rdoeffingers Tools oder Toligen erzeugen.

Ich will ja nicht (oder nur sehr selten) übersetzen, sondern nachschlagen und mehr über Worte/Begriffe erfahren, etwa korrekte Trennung, Aussprache, Etymologie, evtl. hin und wieder einen Beispielsatz. Die Tolinos haben dazu ja freundlicherweise die Funktion "Nachschlagen" und dazu wird eben ein einsprachiges Nachschlage-Wörterbuch benötigt, wie etwa "EN.quickdic" oder "DE.quickdic".

Übertragen auf echte Bücher: Ich schlage eher im Duden, im Oxford oder im Webster’s nach. Nur ganz selten greife ich einmal zum einem Pons oder Langenscheidt Übersetzungs-Wörterbuch.
Reply 

#4  Doitsu 12-14-2021, 08:58 AM
Quote Moonbase59
Allerdings liegt mein Fokus auf einsprachigen Nachschlagewerken, wie man den Beiträgen vielleicht nicht deutlich genug entnimmt.
Möglicherweise, ist das Tool nur dazu geeignet, bilinguale Wörterbücher zu erstellen.
Falls Du eine entsprechende Quelldatei hast, kannst Du ja mal versuchen, es auszutricksen, indem Du bei einem monolingualen Wörterbuch einfach Deutsch als Zielsprache auswählst.

Quote Moonbase59
Die Tolinos haben dazu ja freundlicherweise die Funktion "Nachschlagen" und dazu wird eben ein einsprachiges Nachschlage-Wörterbuch benötigt, wie etwa "EN.quickdic" oder "DE.quickdic".
Möglicherweise haben diese Wörterbücher ein anderes Format und können deshalb mit den bekannten Tools nicht erstellt werden.

Eine gute Quelle für einsprachige Wörterbücher ist übrigens auch das Wordnet-Projekt. Wenn Du nach Wordnet und Stardict oder Kindle suchst, müsstest Du passende Wörterbücher finden, die dann dekompilieren kannst.

Das Fehlen ordentlicher Wörterbücher war bei mir übrigens einer der Hauptgründe, aus denen ich mich gegen einen Tolino und für einen Kindle entschieden haben, denn registrierte Kindle-Benutzer können kostenlos monolinguale und bilinguale EFIGS Wörterbücher herunterladen.

Außerdem kann man problemlos weitere monolinguale und bilinguale Wörterbücher mit dem kostenlosen Amazon-Tool Kindlegen erstellen.
Reply 

#5  Moonbase59 12-14-2021, 10:24 AM
Quote Doitsu
Möglicherweise, ist das Tool nur dazu geeignet, bilinguale Wörterbücher zu erstellen.
Nein, es erstellt ja selbst auch die einsprachigen, allerdings enthalten diese zuviel Wiktionary-Auszeichnungscode.

Quote Doitsu
Möglicherweise haben diese Wörterbücher ein anderes Format und können deshalb mit den bekannten Tools nicht erstellt werden.
Aber Vermutungen helfen hier nicht weiter, steht ja alles in den angegebenen Quellen und den GitHub-Issues.

Quote Doitsu
Eine gute Quelle für einsprachige Wörterbücher ist übrigens auch das Wordnet-Projekt.
Wordnet hat nur ein (allerdings gutes) EN-EN dictionary. Aber auch diese Konvertierung scheitert natürlich daran, dass die Tools derzeit keine Erstellung von .quickdic-Wörterbüchern mit nur einem Index erlauben.

Ich selbst bin leider wegen fehlender Java-Kenntnis nicht in der Lage, den Code zu reparieren und einen Pull Request zu erstellen.

Deswegen ja die Bitte zur Mithilfe (auf GitHub, bei rdoeffinger).
Reply 

#6  rantanplan 12-14-2021, 11:49 AM
Ich hab eine total verwegene Idee:
Was wäre denn, wenn man mal den Technikleiter Frank Bauer anschreibt und nachfragt, mit welchen Tools das offiziell gemacht wird?
Reply 

#7  Moonbase59 12-15-2021, 09:13 AM
Ich fürchte, da wird man vermutlich das hören, was der Support auch den Kunden mitteilt: »Gehen Sie auf https://github.com/rdoeffinger/Dictionary/… und laden Sie neue Wörterbücher dort herunter.« …

Man darf nicht vergessen, dass auch die Tolinos nur ein Legobaukasten aus vielen Stückchen freier und Open-Source-Software sind … Allerdings sind auch ein paar Dinge für meinen Geschmack ganz gut.

Wird also nichts helfen als den einen oder anderen "Baustein" upstream beim bzw. mit dem Ersteller selbst zu verbessern. In diesem Falle eben die .quickdic-Wörterbücher. Nur schade, dass die nicht von pyglossary unterstützt werden.
Reply 

Today's Posts | Search this Thread | Login | Register