Petits problèmes XML (exif, iptc)

Questions générales en Français

Moderators: helmut, XnTriq, xnview

Post Reply
RockyRoad
Posts: 6
Joined: Wed Jul 19, 2006 12:57 pm

Petits problèmes XML (exif, iptc)

Post by RockyRoad »

Bonjour,

D'abord, bravo pour XnView, je sens que je ne vais plus savoir m'en passer :-)

En particulier, j'apprécie beaucoup la possibilité d'exporter les metadonnées en différents formats. Personnellement, j'affectionne le xml.
Mais quelques petits soucis surviennent pour manipuler les fichiers générés lorsque la langue choisie est le français:

:bug: 1 - bien que l'entête xml specifie l'encodage "utf-8", le contenu est en "windows-1252" (ou latin-1 ...), peut-être tout simplement parce qu'il s'agit de l'encodage par défaut du système. Pour être correct sur tout système, il faudrait soit écrire en utf-8, soit spécifier dans l'instruction xml l'encodage effectivement utilisé.

:bug: 2 - Les noms d'éléments sont traduits en français :shock: ... mais deviennent des noms illégaux (not a QName) et ne peuvent être adressés par XPath/XSLT. Il me semblerait plus sage de laisser la structure en anglais, la traduction n'intervenant qu'au niveau présentation (par exemple une feuille de style xsl présentant les données xml au format html).

Si le 2e point peut être facilement contourné en choisissant l'anglais comme langue d'interface, le premier oblige à une rectification manuelle, qui peut être délicate, de chaque fichier.

Hope this helps :)
User avatar
Clo
XnThusiast
Posts: 4441
Joined: Sun Oct 17, 2004 4:57 am
Location: Bordeaux, France
Contact:

Pas assumé

Post by Clo »

:) Bonjour, bienvenue à bord !

1. UTF-8 n'est pas assumé du tout dans XnView, on a déjà vu un cas similaire ici dans le forum Français…

2. Seul l'Auteur peut vous répondre quand il sera disponible (semble absent actuellement…)
- Toutefois, utiliser l'Anglais en interface n'est pas une solution, certains utilisateurs sont incapables de s'en servir… :(

- Nota :  personnellement, XML me colle des boutons sur le nez, une allergie incurable… Image

:mrgreen: Cordialement,
Claude
Clo
Old user ON SELECTIVE STRIKE till further notice
User avatar
xnview
Author of XnView
Posts: 46238
Joined: Mon Oct 13, 2003 7:31 am
Location: France
Contact:

Re: Petits problèmes XML (exif, iptc)

Post by xnview »

RockyRoad wrote: :bug: 1 - bien que l'entête xml specifie l'encodage "utf-8", le contenu est en "windows-1252" (ou latin-1 ...), peut-être tout simplement parce qu'il s'agit de l'encodage par défaut du système. Pour être correct sur tout système, il faudrait soit écrire en utf-8, soit spécifier dans l'instruction xml l'encodage effectivement utilisé.
Oui effectivement il faut que cela soit windows-1252
:bug: 2 - Les noms d'éléments sont traduits en français :shock: ... mais deviennent des noms illégaux (not a QName) et ne peuvent être adressés par XPath/XSLT. Il me semblerait plus sage de laisser la structure en anglais, la traduction n'intervenant qu'au niveau présentation (par exemple une feuille de style xsl présentant les données xml au format html).
Quels noms sont illégaux? N'est ce pas mieux de faire un xml avec des noms fr??
Pierre.
RockyRoad
Posts: 6
Joined: Wed Jul 19, 2006 12:57 pm

Re: Petits problèmes XML (exif, iptc)

Post by RockyRoad »

Bonjour,

Merci de votre réponse.
Oui effectivement il faut que cela soit windows-1252

Attention ! ne pas coder windows-1252 "en dur" si on veut que XnView fonctionne correctement ailleurs sur la planète!
Quels noms sont illégaux?
C'est un peu comme dans les langages de programmation, bien que plus tolérant. les apostrophes (TempsD'exposition) et caractères d'espacement et de ponctuation (Date¦heureNumérisées)(voir w3c http://www.w3.org/TR/2004/REC-xml-20040204/#NT-Name pour la liste officielle).
Il est impossible de construire des expressions XPath valides (c'est-à-dire d'utiliser les données) avec de tels noms.
N'est ce pas mieux de faire un xml avec des noms fr??
Voit-on beaucoup de langages de programmation couramment utilisés utilisant le français ? Moi non, tout simplement déjà à cause des problèmes d'encodage, l'ASCII pur ne supportant pas les caractères accentués.
J'ai même pris l'habitude de commenter mes programmes plutôt en anglais, car je trouve que le pseudo-français se passant des accents est souvent très ambigü.

S'il s'agit d'être lisible et convivial pour le plus grand nombre, le xml brut n'est certainement pas le meilleur choix, comme nous le fait remarquer Clo.

Par contre, le xml est précieux dès qu'il s'agit de convertir, réorganiser, présenter sous différents formats, transférer d'un programme à l'autre des données (qui appartiennent à l'utilisateur, non au programmeur !)
Mais si on change les noms d'éléments/d'attributs, tous les outils de conversion sont à réécrire :shock: !

Une des transformations les plus courantes est la présentation de données xml sous forme de page Web (html). Là, on peut s'attacher à être convivial.

Si vous le souhaitez, je pourrais créer un tel document (xsl), reprenant les traductions, dès que j'aurais le temps.

--------
Je voudrais préciser à Clo:
- Toutefois, utiliser l'Anglais en interface n'est pas une solution, certains utilisateurs sont incapables de s'en servir…
C'est bien pour eux que je propose cette modif ...


Cordialement

Michelle
User avatar
Clo
XnThusiast
Posts: 4441
Joined: Sun Oct 17, 2004 4:57 am
Location: Bordeaux, France
Contact:

Petits trucs…

Post by Clo »

—> RockyRoad

:) Bonsoir,
C'est bien pour eux que je propose cette modif ...
• Merci pour eux !

• En ce qui concerne les caractères récalcitrants dans la programmation,
je vous recommande de bien vouloir jeter un œil ICI et au dessus, cela peut aider ;)

- Et enfin un détail important pour vous à voir ICI et la suite s'il vous plait…:P

:mrgreen: Cordialement,
Claude
Clo
Old user ON SELECTIVE STRIKE till further notice
RockyRoad
Posts: 6
Joined: Wed Jul 19, 2006 12:57 pm

Post by RockyRoad »

--> Clo
:mrgreen: J'espère que tu te sens mieux maintenant ?

8) Michelle
User avatar
Clo
XnThusiast
Posts: 4441
Joined: Sun Oct 17, 2004 4:57 am
Location: Bordeaux, France
Contact:

Ouf ! Foin des boutons…

Post by Clo »

:D Oui, merci, l'éruption se résorbe… ;)

:mrgreen: Cordialement,
Claude
Clo
Old user ON SELECTIVE STRIKE till further notice
RockyRoad
Posts: 6
Joined: Wed Jul 19, 2006 12:57 pm

caractères récalcitrants

Post by RockyRoad »

Depuis le temps que je travaille avec xml, je sais utiliser les entités numériques, merci !
C'est gentil de répondre aux mails, c'est bien de les lire aussi! :wink:

Bonne nuit

Michelle
User avatar
xnview
Author of XnView
Posts: 46238
Joined: Mon Oct 13, 2003 7:31 am
Location: France
Contact:

Re: Petits problèmes XML (exif, iptc)

Post by xnview »

RockyRoad wrote:
Oui effectivement il faut que cela soit windows-1252

Attention ! ne pas coder windows-1252 "en dur" si on veut que XnView fonctionne correctement ailleurs sur la planète!
Comment ça? Ce sera toujours du windows-1252
Quels noms sont illégaux?
C'est un peu comme dans les langages de programmation, bien que plus tolérant. les apostrophes (TempsD'exposition) et caractères d'espacement et de ponctuation (Date¦heureNumérisées)(voir w3c http://www.w3.org/TR/2004/REC-xml-20040204/#NT-Name pour la liste officielle).
Il est impossible de construire des expressions XPath valides (c'est-à-dire d'utiliser les données) avec de tels noms.
N'est ce pas mieux de faire un xml avec des noms fr??
Voit-on beaucoup de langages de programmation couramment utilisés utilisant le français ? Moi non, tout simplement déjà à cause des problèmes d'encodage, l'ASCII pur ne supportant pas les caractères accentués.
J'ai même pris l'habitude de commenter mes programmes plutôt en anglais, car je trouve que le pseudo-français se passant des accents est souvent très ambigü.

S'il s'agit d'être lisible et convivial pour le plus grand nombre, le xml brut n'est certainement pas le meilleur choix, comme nous le fait remarquer Clo.
Ok, donc effectivement, il est mieux de garder l'anglais... En fait, je voulais sortir un peu comme le texte ou excel...
Pierre.
RockyRoad
Posts: 6
Joined: Wed Jul 19, 2006 12:57 pm

Post by RockyRoad »

Bonjour Pierre,
Comment ça? Ce sera toujours du windows-1252

Ben, pas chez un japonais ou un russe, à moins qu'on le précise explicitement.
Lorsqu'on ne précise pas l'encodage d'un fichier texte, sur un système français, c'est un code "occidental", windows-1252 en général, qui est utilisé.
Mais sur un système prévu pour le cyrillique, certainement pas.
Des problèmes d'affichage sont donc fréquents pour les fichiers texte ordinaires, mais sont normalement résolus en XML grâce à la déclaration en début de fichier. Si elle est absente, c'est UTF-8 qui est assumé pour un fichier xml, quelque soit la "nationalité" du système.
C'est pourquoi lorsqu'on écrit du xml, il faut préciser explicitement l'encodage utilisé, soit en interrogeant une fonction comme :

Code: Select all

System.Text.Encoding.Default 
pour ecrire la déclaration

Code: Select all

<?xml ...
, soit en precisant l'encodage utf-8 en ouvrant le fichier de sortie.

Grâce à cela, les légendes des images s'afficheront correctement aux 4 coins de la planète :). Mais du xml où l'encodage est incorrect s'affichera mal partout :(


Je ne peux pas être plus précise sans connaître le langage et les librairies utilisés par XnView ... quelques pointeurs tout de même:

http://msdn.microsoft.com/library/defau ... rTopic.asp

http://msdn2.microsoft.com/en-us/librar ... riter.aspx

Bon courage, et tous mes voeux de succès pour XnView :-)

Michelle
User avatar
xnview
Author of XnView
Posts: 46238
Joined: Mon Oct 13, 2003 7:31 am
Location: France
Contact:

Post by xnview »

RockyRoad wrote: Je ne peux pas être plus précise sans connaître le langage et les librairies utilisés par XnView ... quelques pointeurs tout de même:

http://msdn.microsoft.com/library/defau ... rTopic.asp

http://msdn2.microsoft.com/en-us/librar ... riter.aspx
En fait c'est du C/C++, et je n'utilise pas de lib speciale... Je ferais les corrections...

Et je viens de m'apercevoir que l'IPTC est toujours en anglais, alors que l'EXIF depend de la langue :-)
Pierre.
RockyRoad
Posts: 6
Joined: Wed Jul 19, 2006 12:57 pm

Petits problèmes XML (exif, iptc)

Post by RockyRoad »

Bonjour Pierre,
En fait c'est du C/C++, et je n'utilise pas de lib speciale... Je ferais les corrections...
Si on veut être sûrs de produire du xml correct, quels que soient les caractères contenus dans les descriptions d'images, sans avoir à réinventer la roue, il est peut-être intéressant d'utiliser une librairie robuste telle que xerces http://xml.apache.org/xerces-c/ (la référence pour java, je n'ai pas testé en C++)[/url]. Il y a un petit guide en français ici:
http://www.supinfo-projects.com/en/2004/xerces%5Fcpp/4/.
Et je viens de m'apercevoir que l'IPTC est toujours en anglais, alors que l'EXIF depend de la langue
Si le nom des champs varie d'une langue à l'autre, je tenterais de les écrire sous une forme du genre:

Code: Select all

<field tagid="296" label="Unité de résolution">Pouce</field>
en français, et en anglais:

Code: Select all

<field tagid="296" label="Unit of X and Y resolution">Inch</field>
En utilisant un identifiant invariant (EXIF Tag ID), on dispose d'une clé qui permet d'extraire des données dans se soucier de la langue.

Mais ce n'est qu'une humble suggestion.

Cordialement,
Michelle
Post Reply