Abonnement à ma liste de contacts

Etoiles inactivesEtoiles inactivesEtoiles inactivesEtoiles inactivesEtoiles inactives
 

Aujourd'hui, je souhaite revenir sur un reportage pas très glorieux à propos du sens caché des emoji sur lequel je ne m'étendrai pas.
Si le sujet pouvait sembler anecdotique ou peu reluisant, il contenait néanmoins une information technique très intéressante, sur laquelle je voulais écrire depuis longtemps.

En effet, même si certains utilisent les emoji pour des recherches très peu recommandables, il est intéressant d’examiner, d’un point de vue purement technique, comment ils fonctionnent.
Et si j’ai décidé de rédiger cet article, c’est aussi parce que, dans le cadre de ma propre documentation technique sous Joomla, j’ai déjà utilisé cette méthode pour retrouver plus facilement certains documents.

Le besoin

Dans notre besoin, nous devions différencier deux grandes "catégories fonctionnelles" d’articles dans Joomla. (je ne parle pas du champs catégorie de Joomla mais bien d'une catégorisation "métier" du contenu de l'article)
Ces catégories regroupaient des éléments fonctionnels, mais n’étaient pas accessibles directement via le champ « Catégorie ». Nous aurions pu utiliser un système de tags, mais nous ne l’avons pas retenu : le tag n’était pas visible dans les résultats de recherche documentaire.

Nous avons donc choisi une autre approche : utiliser un emoji en début de titre, permettant de distinguer visuellement et rapidement les deux types d’articles fonctionnels.

Fonctionnement technique

Un emoji n’est pas une image, mais un véritable caractère encodé en UTF-8.
Si vous explorez la table UTF-8, vous trouverez :

  • des lettres latines, arabes, chinoises, etc.,
  • mais aussi des symboles, pictogrammes et icônes.

Chaque caractère appartient à une plage de codes (ou « zone ») définie dans la table Unicode. Certains codes ne correspondent pas à des lettres, mais à des représentations graphiques : ce sont les emojis.

Mise en garde

Il faut être vigilant sur l’encodage : UTF-8, UTF-16 ou UTF-32.
J’ai déjà rencontré de sérieux problèmes avec des pages HTML générées par Microsoft Word, qui encode par défaut en UTF-16. Résultat : ouvrir ces pages dans un autre navigateur que celui de Microsoft affichait… une page blanche.

En clair, assurez-vous que vos pages et vos bases de données utilisent le même encodage (UTF-8 de préférence).

La problématique

Nous voulions :

  1. Catégoriser différents types d’articles visuellement,

  2. Pouvoir effectuer des recherches basées sur ces catégories.

L’idée a donc été : faire commencer chaque titre d’article par un emoji.
Puisque cet emoji est un caractère à part entière, il est indexé par le moteur de recherche et il est donc possible d'effectuer une recherche sur ces caraactères.

Petite précision : je n’utilise pas la recherche classique de Joomla, mais l’outil rokAjaxSearch (AJAX).

Le résultat

Même si j’étais sceptique au départ, le test a été concluant :

  • Les articles dont le titre commençait par un emoji étaient bien trouvés par le moteur de recherche.
  • Avantage visuel : l’emoji permet de repérer instantanément la catégorie d’un article.
  • Avantage technique : l’emoji étant un caractère, il peut servir de critère de recherche.

Ouvertures possibles

Puisque l’emoji (ou tout autre caractère graphique UTF-8) est indexé, il est possible d’aller plus loin :

  • Utiliser plusieurs emoji pour "'affecter un article à plusieurs catégories",
  • Marquer visuellement vos contenus,
  • Faciliter et accélérer la recherche documentaire.

En résumé, un simple caractère peut devenir un outil de classement puissant, combinant efficacité visuelle et précision technique.

 

 

 

Vous retrouverez ici tous mes articles explicatifs de mes concepts, mes résultats d'analyses techniques m'ayant permi d'aboutir à un fonctionnement de mes applicatifs très fonctionnel

Rapport sondage marche

Voici le rapport statistique du sondage (auquel vous pouvez toujours répondre) que j'ai lancé sur le sujet

Mon GitHub

Voyant que l'intégration du flux RSS ralentissait tout mon site, voisi le simple lien de mon flux RSS : Mon GitHub