Mobileread
Englisches Wiktionary Wörterbuch für Pocketbook
#1  SIRSteiner 09-12-2012, 12:51 AM
Hallo Leser,

dies ist ein Thread über das Erstellen eines englischen Dictionarys (En-En) auf Basis von en.wiktionary.org ergänzt mit Hilfe des Webster's 1913 dictionary.

Stand 04.10.2012, 01:50 Uhr:
- Das Parsen von en.wiktionary.org ist abgeschlossen!
- Fehlende Einträge von Webster's 1913 hinzugefügt.
- 472.018 Einträge!!!

ACHTUNG!!! Ich habe das Wörterbuch umbenannt, da es nicht mehr ausschließlich aus dem Wiktionary besteht.

Gruß
Ronny

PS: Zum Verwenden des Wörterbuches einfach die zip entpacken und die dic-Datei in das Verzeichnis /system/dictionaries kopieren. Dann sollte das Wörterbuch in der Liste der Wörterbücher erscheinen.
[zip] RS-Dictionary (En-En).zip (18.90 MB, 2865 views)
Reply 

#2  SIRSteiner 09-14-2012, 12:41 AM
Hallo,

ich habe Scripte und Filter überarbeitet, um die Texte zu bereinigen. Die meisten Einträge müssten "clean" sein. Ich habe zunächst nur 11.750 Einträge zur Fehlerermittlung erstellt. Solltet Ihr außer den o.g. Problemen weitere entdecken, bitte melden. Im allgemeinen wäre ich dankbar über ein Feedback, ob ich auf dem richtigen Weg bin.

Gruß
Ronny
Reply 

#3  SIRSteiner 09-15-2012, 04:20 PM
Hallo liebe Leser,

mittlerweile schleichen sich immer weniger Fehler bei der Umwandlung ein. Aktuell beinhaltet das englische Wörterbuch 35.200 Begriffe. Da das Endergebnis nach meiner Schätzung mehr als 400.000 Begriffe beinhalten wird, ist noch viel zu tun. Dennoch wäre es schön, wenn Ihr einfach darin blättert und mir ein Feedback gebt, was bisher noch nicht erfolgte.

Gruß
Ronny
Reply 

#4  troll05 09-15-2012, 05:16 PM
Öhm, womit kann ich ne *.dic Datei lesen?
Reply 

#5  SIRSteiner 09-16-2012, 02:48 AM
Hallo troll05,

die "dic" kopierst Du einfach auf Deinen PB (622) in das Verzeichnis /system/dictionaries/. Dann kannst Du das Wörterbuch verwenden.

Übrigens habe ich die "dic" soeben aktualisiert. Sie hat jetzt 50.530 Einträge. Es wird...

Gruß
Ronny
Reply 

#6  mmat1 09-16-2012, 06:26 AM
Quote SIRSteiner
die "dic" kopierst Du einfach auf Deinen PB (622) in das Verzeichnis /system/dictionaries/. Dann kannst Du das Wörterbuch verwenden.
Naja, um mal eben schnell ein paar 50.000 Einträge zu sichten ist die Anzeige vom PB denn doch etwas zu mickrig. Das ist halt ein Wörterbuch.
Oder kann man die Wörterbücher auch separat irgendwie öffenen, so wie ein normales Buch ?
Reply 

#7  SIRSteiner 09-16-2012, 06:48 AM
Quote mmat1
Naja, um mal eben schnell ein paar 50.000 Einträge zu sichten ist die Anzeige vom PB denn doch etwas zu mickrig. Das ist halt ein Wörterbuch.
Oder kann man die Wörterbücher auch separat irgendwie öffenen, so wie ein normales Buch ?
Man kann es ganz normal über das Menü "Wörterbücher" öffnen und darin suchen. Weiterblättern geht auch mit wischen oder Taste. Zurückblättern geht nicht.

Mir geht es darum, ein Feedback zu erhalten, ob man damit arbeiten könnte. Ich benötige es eigentlich nicht. Da aber auf Grund des von mir erstellten deutschen Wiktionary-Wörterbuches der Wunsch nach dem englischen geäußert wurde, habe ich mich daran gewagt. Das englische Wiktionary beinhaltet eben viele Wörter, die es in anderen Wörterbüchern nicht gibt (z.B. quoth, quethe...). Das Sichten nach fehlerhaften Zeichen/-ketten habe ich weitestgehen abgeschlossen/automatisiert. Lediglich diverse Sonderzeichen sind noch offen bzw. kann der PB nicht darstellen. So habe ich sämtliche mathematischen Ausdrücke entfernen müssen, da sich das nicht umsetzen lässt. Auch musste ich Synonyme, nichtenglische Begriffe u.ä. weglassen und mich "nur" auf die Bedeutungen englischer Wörter und Fremdwörter konzentrieren, da es sonst zu umfangreich würde und wahrscheinlich Jahre dauern würde.

Wie gesagt, mir geht es im Feedback um Stichproben und einer Aussage, ob man damit zurecht kommt.

Danke und Grüße
Ronny
Reply 

#8  mmat1 09-16-2012, 07:01 AM
Quote SIRSteiner
Wie gesagt, mir geht es im Feedback um Stichproben und einer Aussage, ob man damit zurecht kommt.
Meiner Stichprobe zur Folge verhält sich das Ding nicht anders wie andere Wörterbücher, man hat halt eine Liste und kann nochmal Details aufrufen....

Insofern: Gute Arbeit
Reply 

#9  SIRSteiner 09-17-2012, 12:49 AM
Guten Morgen!

Aktueller Stand des englischen Wiktionary: 74.110 Einträge
Da keine Probleme berichtet wurden, werde ich ab sofort keine Fehlersuche mehr unternehmen, da dies doch recht viel Zeit in Anspruch nimmt.

Darüber hinaus informiere ich nur noch aller vollen 50.000 Einträge über die Aktualisierung, werde jedoch versuchen, so oft wie möglich den Download im Posting 1 zu aktualisieren.

Viele Grüße
Ronny
Reply 

#10  sebigbos 09-17-2012, 03:15 AM
Danke, cooler Job!
Reply 

  Next »  Last »  (1/4)
Today's Posts | Search this Thread | Login | Register