Mobileread
E-Books Discussion sur le format Epub
#1  Coolmicro 01-31-2009, 11:20 AM
Nous avions commencé une discussion sur l'epub, en détournant honteusement le sujet de Robert sur Cyrano - http://www.mobileread.com/forums/showthread.php?t=36651

Zelda a ensuite créé un sujet en anglais sur le forum epub, mais bon, nous ne nous exprimons pas tous facilement en anglais, moi le premier, il semble utile qu'il y ait un sujet sur ce format, en français, quitte à ce que Zelda transmette au forum en anglais les idées qui lui semblent intéressantes (à mettre en sticky, peut-être? étant donné l'importance du sujet).

J'ai fait beaucoup de tests, réfléchi sur la question, discuté avec Hadrien par mail.

Mes tests ont eu lieu avec Calibre. Il est apparu que lorsqu'on on entrait du HTML obtenu avec Word ou OpenOffice dans Calibre, le résultat apparaissait correct au premier abord, mais Epubcheck révélait ensuite de nombreux problèmes.

Par contre, lorsqu'on entre de l'ODT (OpenOffice par exemple) dans Calibre, le résultat est bon, les problèmes résiduels qui demeurent étant dus à Calibre, et non au document lui-même. Voir pour ceux que ça intéressent :
http://www.mobileread.com/forums/sho...=29350&page=20
http://www.mobileread.com/forums/sho...=29350&page=21

Je rappelle que la discussion précédente tournait autour du besoin d'un logiciel accessible à tous, pas trop compliqué, mais produisant des epub de qualité.

Je pense que Calibre pourrait plus ou moins y parvenir un jour (car c'est déjà un bon logiciel), mais je n'en suis pas sûr, car c'est difficile avec un logiciel qui a pour ambition de tout accepter en entrée, et plusieurs format en sortie. Il serait nettement préférable qu'apparaisse un logiciel spécialisé pour la production de l'epub, qui ne fasse que ça.

Contrairement à ce que je pensais et à ce que j'ai pu dire précédemment, j'ai enfin compris qu'il est impossible de produire un bon epub en entrant, par exemple, du HTML. Il faut entrer des flux XHTML structurés pour qu'un logiciel puisse fournir en sortie un epub correct. Mais, fournir de tels flux XHTML n'est pas à la portée de tout le monde, et je continue de penser que le traitement de texte est la seul base pour que le commun des mortels, avec des connaissances informatiques moyennes, puisse faire des ebooks ou des documents divers.

La conclusion de tout ça est qu'à mon avis, la seule base possible pour alimenter un logiciel de production d'epub, en dehors de flux XHTML, est le format ODF (ODT pour le traitement de texte), qui est le seul qui soit ouvert, libre, standardisé et suffisamment structuré. Les tests faits avec Calibre montrent déjà que c'est possible, et il est probable que le travail déjà effectué au niveau de Calibre concernant l'epub pourrait en partie être réutilisé pour un autre logiciel si nécessaire. De plus avec OpenOffice (qui n'est pas la seule application à travailler avec l'ODF, mais qui est la plus connue et la plus accessible), il est possible et facile de styler entièrement un document selon des normes précises qui seraient édictées, par exemple, par le logiciel destiné à produire de l'epub. On peut même imaginer qu'un modèle OpenOffice soit fourni en complément d'un tel logiciel, avec les styles devant être utilisés pour la structuration du document (pourquoi pas un style parties de niveau 1, un style chapitres de niveau 2, un style sections de niveau 3, etc)
Reply 

#2  zelda_pinwheel 01-31-2009, 11:28 AM
excellente initiative, coolmicro ! merci. j'en ai fait un sticky. je pars pour l'apéro MR là mais je reviendrai pour la discussion.
Reply 

#3  Coolmicro 02-04-2009, 11:34 AM
Bonne nouvelle, la nouvelle version d'Adobe Digital Edition vient de sortir, et elle prend enfin en compte la justification des lignes.

Mauvaise nouvelle: cette justification doit être codée dans les balises du XHTML, et ne s'applique donc pas si le fichier XHTML n'intègre pas la justification.

Le lecteur n'a donc pas vraiment la possibilité de choisir de justifier ou non son texte, contrairement, par exemple, à un lecteur comme Mobipocket.

Donc, pour le moment, il vaut mieux intégrer la balise justify, la majorité des lecteurs préférant se voir "imposer" la justification des lignes plutôt que cette justification soit absente.
Reply 

#4  Coolmicro 02-04-2009, 11:42 AM
Autre bonne nouvelle: dans la dernière version de Calibre, les derniers bugs qui posaient de sérieux problèmes de validité pour les ebooks epub produits, ont été corrigés (sauf une "coquetterie" du développeur, par ailleurs sans grande importance). De plus il y a maintenant 3 niveaux possibles pour la table des matières.

Voici le résultat que nous avons obtenus sur un fichier qui posait de nombreux problèmes auparavant:
http://ebooksgratuits.com/epub/loti_les_desenchantees.epub
Rappelons que nous utilisons, en entrée de Calibre, un document odt (OpenOffice).

Sans atteindre à la qualité professionnelle et à la souplesse de Feedbooks, c'est quand même maintenant une bonne solution, envisageable pour produire des ebooks epub de qualité.
Reply 

#5  Hadrien 02-05-2009, 05:23 AM
Par contre tu devrais ajouter une marge au moins à droite: Adobe DE a la mauvaise manie d'afficher les numéros de page dans la marge droite, et cela risque de poser problème si tu n'en as pas, avec ces numéros s'affichant par dessus le texte.
Reply 

#6  Hadrien 02-05-2009, 10:18 AM
J'ai l'impression que tu as des soucis de métadonnées aussi vu ce qui est affiché dans DE, il faudrait que je décortique ton OPF...
Reply 

#7  Coolmicro 02-05-2009, 12:23 PM
Quote Hadrien
Par contre tu devrais ajouter une marge au moins à droite: Adobe DE a la mauvaise manie d'afficher les numéros de page dans la marge droite, et cela risque de poser problème si tu n'en as pas, avec ces numéros s'affichant par dessus le texte.
C'est le même problème que pour la justification, il faut pallier les insuffisances de Adobe DE en mettant dans l'ebook des choses qui ne devraient pas y être. Dans Mobipocket Reader, ou même dans FBReader (qui est pourtant loin d'être un modèle en matière de fidélité du rendu), l'utilisateur peut définir ses marges, et c'est ainsi que cela doit être.

Comme tu l'as souligné à plusieurs reprises, l'organisation artisanale d'ELG ne permet pas de faire ensuite la mise à jour d'un format lorsqu'il y a des changements au niveau de ce format. Donc, si j'introduis ces marges, elle resteront et se surajouteront aux marges du lecteur lorsque Adobe DE aura enfin implémenté cette fonction.

J'ai essayé avec des marges toutes petites (0,3 cm de chaque coté) et j'ai demandé aux utilisateurs de petits écrans de tester (iphone+stanza).

C'est toujours:
http://ebooksgratuits.com/epub/loti_les_desenchantees.epub
Reply 

#8  Coolmicro 02-05-2009, 01:12 PM
Quote Hadrien
J'ai l'impression que tu as des soucis de métadonnées aussi vu ce qui est affiché dans DE, il faudrait que je décortique ton OPF...
Je ne pense pas que tu fais allusion à la faute d'orthographe due à une trop grande précipitation. Donc, la seule chose que je vois, qui peut te paraître anormale, c'est l'absence d'accent. C'était volontaire car les titres ou noms d'auteurs saisis avec accents dans Calibre me donnent des caractères bizarres sous Adobe DE (peut-être parce que je travaille sous Linux, sous sous XP virtualisé ??). Aussi j'ai fait le choix de virer les accents pour les tests...

Mais, comme tu peux le voir dans la dernière version de Loti, les accents sont en place: il m'a fallu éditer le fichier OPF manuellement pour cela...
Reply 

#9  Coolmicro 02-05-2009, 01:20 PM
A propos du livre de Loti, Hadrien, je voudrais discuter de ce qui m'apparaît comme le seul défaut de Feedbooks concernant l'édition des livres. Je ne parle évidemment pas de validité des formats, sur ce plan vous êtes irréprochables, mais du nommage des parties et chapitres, et de la numérotation automatique.

Chez ELG, nous attachons une grande importance au respect maximum de l'édition papier utilisée, et le nommage des parties et chapitres, le mode de numérotation et le libellé de numérotation, en font partie. Encore plus important: quand un auteur comme Loti fait le choix de numéroter les chapitres à la suite, sans recommencer la numérotation à chaque chapitre, cela a une signification littéraire, et les parties n'ont plus alors exactement le même rôle que dans une numérotation qui recommence à chaque partie. C'est le cas du livre en exemple.
Il faudrait que la numérotation et le libellé automatique de numérotation soient débrayables dans l'interface Feedbooks, qu'on ait la possibilité de mettre:
PREMIÈRE PARTIE
....
SIXIÈME PARTIE
et
I
II
III
...
XLVII
toujours en prenant l'exemple du même livre.
Je parle évidemment de ce que le lecteur voit, cela n'empêche pas que vous gardiez votre numérotation en interne dans votre BD.
Il faut aussi signaler que parfois, un numéro de chapitre est absent d'un livre, et que cela signifie parfois que ce chapitre a été perdu (cas de la littérature populaire publiée en feuilleton); dans ce cas, toute édition sérieuse se doit de respecter la numérotation absente du chapitre absent.
Reply 

#10  Hadrien 02-06-2009, 06:39 AM
C'est cela qui n'est pas bon sur l'auteur dans l'OPF:
<dc:creator opf:role="aut" opf:file-as="Loti Pierre">Loti Pierre</dc:creator>
Tu devrais avoir:
<dc:creator opf:role="aut" opf:file-as="Loti, Pierre">Pierre Loti</dc:creator>

Sinon après avoir étudié l'OPF, je ne sais vraiment pas ce qu'il a foutu Kovid, il déclare son propre namespace (xmlns:calibre="http://calibre.kovidgoyal.net/2009/metadata") mais il utilise des balises meta pour series_index et rating.

Sinon je vois un autre problème potentiel: les livres fabriqués par Calibre sont très loins d'avoir des identifiants uniques. Ce fichier a "280" comme identifiant, ce qui n'est pas du tout assuré d'être un identifiant unique. Or le standard stipule bien que c'est le devoir du producteur de contenu d'associer un identifiant unique à son fichier ePub/livre.

Pour la numérotation: dans ce cas la tu peux utiliser des sections plutôt que des chapitres, et tout numéroter toi même manuellement (tu perdras juste nos en-têtes de chapitre). Plus tard sinon on permettra surement soit de modifier le template, soit de forcer une numérotation manuelle. Mais à l'heure actuelle, c'est quand même plus simple de partir d'une automatisation, étant donné que pour la grande majorité des livres, il ne sera pas nécessaire de modifier la numérotation, et donc ça simplifie les choses pour les auteurs se publiant chez nous ou les contributeurs.
Reply 

  Next »  Last »  (1/2)
Today's Posts | Search this Thread | Login | Register