Carte heuristique autour d’Unicode

Cette carte a pour vocation de présenter sous forme graphique toutes les ressources que l’on peut mobiliser sur le Web à propos d’Unicode (et plus particulièrement à propos d’Unicode en bibliothèque).

Chaque branche principale privilégie une approche et des besoins d’utilisateurs différents :

Se renseigner sur Unicode recense des définitions générales de premier niveau et des ressources bibliographiques sur la question ;

Utiliser Unicode décline les outils nécessaires à la saisie ou à la lecture de textes dans un autre alphabet, tant pour les usagers des bibliothèques ou le grand public que pour les professionnels ayant à cataloguer des documents en caractères non latins ;

– Enfin, Quelles ressources pour quel alphabet vous offre un panorama des outils classés par langues ou alphabets non latin (asiatique, cyrillique, arabe et grec principalement).

Cliquez sur l’image pour ouvrir la carte et naviguer dans l’arborescence dynamique !

Carte heuristique sur Unicode en bibliothèque

Panorama des ressources recensées autour d'Unicode

Petite légende à l’intention des lecteurs qui ne sont pas familiers des cartes heuristiques :

– En cliquant sur les + et les placés aux embranchements, vous pouvez à l’envi naviguer dans l’arborescence et déployer plus ou moins chaque branche ;

– Une petite flèche  en haut à droite des bulles de la carte signifie qu’un lien actif vers un site ou une ressource en ligne prolonge la branche de la carte sur le Web ;

– Une petite « fiche » jaune placée dans la bulle ouvre une note explicative quand le curseur de la souris glisse dessus ;

– Un petit trombone dans une bulle indique qu’un document y est attaché.

Normes de translittération (2) : les difficultés en suspens

"Panneau de signalisation bilingue (français et cri) avant d'entrer sur la Route de la Baie James au km 257"

« Panneau de signalisation bilingue (français et cri) avant d'entrer sur la Route de la Baie James au km 257 »

– Translittération et orthographes désuètes

La question du codage des caractères sortis d’usage se pose aux catalogueurs. Les normes de catalogage internationales (ISBD) imposent de retranscrire le titre et la mention de responsabilité d’un document dans la langue et l’écriture de l’original. L’usage adopté dans les différents répertoires catalographiques peut toutefois différer et être source de confusion. À titre d’exemple, pour le russe, différentes lettres de l’alphabet cyrillique ont été supprimées en 1918 par le pouvoir soviétique. Les bibliothèques, si elles suivent toutes la normes ISO-9 de translittération des caractères cyrilliques, ont parfois l’habitude de « convertir » ces mentions aux règles d’orthographe en usage depuis 1918. Ces divergences peuvent être source de doublons entre les notices d’un même document.

Par exemple, on trouve dans  le SUDOC deux règles de transcriptions différentes pour deux tomes de la même collection des œuvres de Léon Tolstoï  (titre seul, en double affichage) ; il s’agit des tome VII et VIII contenant la 3e et la 4e partie du roman Guerre et Paix. Les caractères concernés sont signalés en rouge:

Notice SUDOC n°134375696 (orthographe pré-1918)

Сочинения графа Л. Н. Толстого. Часть VIII, Война и Мир. IV [Texte imprimé]. – Изданіе восьмое

Sočineniâ grafa L. N. Tolstogo. Častʹ VIII, Vojna i Mir. IV [Texte imprimé]. – Izdanìe vosʹmoe

Notice SUDOC n°092133878 (orthographe modernisée)

Сочиненія графа Л. Н. Толстого. VII, Война и Мир. Т. III [Texte imprimé]. – Изданіе восьмое

Sočinenìâ grafa L. N. Tolstogo. VII, Vojna i Mir. T. III [Texte imprimé]. – Izdanìe vosʹmoe

La divergence de la transcription du « i » fausse donc la notice : un utilisateur qui cliquerait sur le lien actif proposé par le titre, ne retrouvera qu’une partie des tomes de l’édition des œuvres complètes de 1889. L’utilisateur averti devra donc copier et coller le titre dans la barre de recherche et remplacer les caractères litigieux par une troncature.

– L’agrégation des morphèmes des langues idéographiques asiatiques

Les langues idéographiques, comme le chinois, le coréen et le japonais sont translittérées en restituant les morphèmes (les sons) qui composent les différents caractères. Mais à la lecture de la transcription, il est difficile d’isoler la série de morphèmes qui retranscrivent un caractère de ceux du caractère suivant. Plusieurs pratiques existent : soit l’agrégation des morphèmes d’un même caractère, pour faciliter la lecture, soit la séparation totale des morphèmes. La pratique la plus courante est de retranscrire les langues asiatiques de façon non agrégée, sauf pour les noms propres, afin de faciliter le travail d’indexation. Toutefois, les pratiques catalographiques des bibliothèques ne sont pas toujours harmonisées, les pratiques ayant divergé selon les périodes de rétroconversion des catalogues papier ou de constitution des catalogues électroniques. Il y a là une source d’ambiguïté qui persiste.

♦ Pour aller plus loin :

Voir le billet « Normes de translittération (1) : généralités » sur notre blog