Accueil > Gnome, Planet, Planet-libre.org, Ubuntu > Tracker : la renaissance

Tracker : la renaissance

Tracker

Tracker est un moteur de recherche local pour votre ordinateur. Il permet d’effectuer des recherches de fichiers, mais aussi dans les fichiers eux même ou encore dans votre courrier électronique.

Ce projet est assez vieux, on parlait de sont inclusion dans le projet Gnome il y à quelques années déjà. Mais à cause de mauvaises performances et d’un développement lent il n’a jamais vraiment pu s’imposer sur le bureau Gnome.

Aujourd’hui c’est d’ailleurs un véritable manque, car aucun réel moteur de recherche n’est implémenté dans Gnome, alors que ce genre de fonctionnalités est maintenant standards ( que ce soit sous KDE, sous Windows Seven ou OSX ).

L’année 2009 à marqué toutefois un réveil du projet, on est ainsi passé de la version 0.5 à 0.7 en un peu plus d’un an et les premiers développements de la nouvelle version 0.8 devraient arriver en 2010.

3 Générations de moteurs de recherches

Pour mieux comprendre la suite de l’article, on va s’arrêter un peu sur les différents types de moteurs de recherches disponibles. Techniquement on peu diviser ces moteurs en 3 générations :

- La première génération ( qui correspond au petit moteur de recherche de fichiers de Gnome ), est un moteur de recherche simple, qui va aller chercher un fichier selon son nom, son type ou sa date de modification. Vous tapez « lenomdemonfichier », Et il s’en va le chercher sur votre ordinateur. Dans le meilleur des cas, il est doté d’un cache pour offrir un temps de réponse plus rapide.

Le gros inconvénient de cette première génération, c’est qu’elle est extrêmement limitée. Vous ne pouvez chercher que par le nom du fichier ou son extension. Et si vous ne vous rappelez pas du nom du fichier ou que vous tapez un nom légèrement erroné, vous n’aurez surement aucun résultat pertinent.

De fait ces moteurs de recherches sont peu utilisés. Et on préférera souvent avoir une bonne organisation de l’arborescence des répertoires pour éviter de perdre nos fichiers.

- La seconde génération de moteur de recherche s’est donc attachée à proposer un résultat de recherche un peu plus efficace. Ici il est question de reprendre les fonctionnalités du moteur de 1ere génération, mais en plus de lui permettre d’aller chercher le contenu des informations de chaque fichier ( lorsque c’est pertinent ). Le gros avantage c’est que la recherche devient un peu plus précise. Vous pouvez par exemple facilement retrouver un document texte sur un thème précis, en tapant un mot contenu dans ce document.

Tracker dans sa version stable 0.6.X fait parti des moteurs de seconde génération. Mais la encore la recherche reste peu utile, car le moteur de recherche ne pourra parcourir que le contenu de fichiers lisibles ( documents textes principalement ). Si vous souhaitez chercher d’autres types de documents, comme des images ou des vidéos, vous vous retrouvez donc avec le même problème que le moteur de première génération.

- C’est ici qu’intervient le moteur de recherche de 3éme génération, qui s’appuie sur le bureau sémantique. Le bureau sémantique consiste à construire un réseau d’informations sur l’ensemble des éléments du bureau; que ce soit les médias, les documents, les applications ou tout autre élément pertinent composant l’ordinateur ou son réseau. Pour chaque élément on va garder en base de donnée des informations pertinentes sur son contenu ( par exemple pour une photo l’auteur de la photo, la date de prise, le lieu, la définition… ). Il sera en plus possible d’associer des tags pour chaque élément ( exemple : photos de vacances ), permettant ainsi de regrouper les fichiers sans prendre en compte l’arborescence.

Enfin, pour rendre le système encore plus intelligent,le système créé des liens entre les différents éléments du bureau. Par exemple votre ami « Paul » vous envoie les photos de vacances que vous avez passés ensemble. Vous les stockez dans un répertoire. Puis quelques jours plus tard vous souhaitez les voir de nouveau. Il vous suffit de chercher « Paul » dans le moteur pour retrouver les fichiers qu’il vous a envoyé. Vous ajoutez le tag « Photo de vacances » et elles se retrouveront dans votre gestionnaire de photos dans la bonne catégorie ( si ce dernier supporte Tracker) .

Tracker 0.7 : le renouveau… expérimental.

Pendant l’année 2009, l’équipe de Tracker à décidé, de refondre totalement le projet. L’objectif est de créer un moteur interne performant, standardisé et facile d’utilisation.

Pour ce faire le projet c’est logiquement orienté vers des standards reconnus.

En premier SPARQL, qui est le langage utilisé pour effectuer des requêtes a la base de donnée de Tracker. SPARQL est un standard défini par la W3C, une des briques du futur web sémantique. Il est officiellement devenu une recommandation en janvier 2008 et permet d’effectuer des requêtes intelligentes en relation avec des documents,images, etc.

La seconde technologie qui fait son entrée dans Tracker s’appel NEPOMUK pour « Networked Environment for Personalized, Ontology-based Management of Unified Knowledge » ou en français : Environnement réseau pour une gestion ontologique personnalisée de la connaissance unifiée.
C’est ni plus ni moins que le standard défini par un projet Européen pour le bureau sémantique que l’on à vu plus haut.

C’est donc avec la version 0.7.X que ces fonctionnalités ont commencés à faire leurs apparitions. De sorte qu’aujourd’hui Tracker propose un moteur de recherche sémantique « simple ». Il manque encore en effet un certain nombre d’éléments comme les liens entre élément, ou plus simplement une meilleure intégration.

Enfin un dernier élément à prendre en compte dans Tracker, s’appel le « mineur ». Ce sont des modules qui viennent s’ajouter au moteur principal et qui vont avoir pour rôle d’aller chercher les informations sur des éléments spécifiques. Pour l’instant Tracker dispose de 3 type de « mineur » :
- Mineur de fichier, qui va aller chercher la liste des fichiers présents dans votre répertoire personnel et va en extraire le contenu.
- Mineur d’applications, qui récupère le nom et les descriptions des applications présentes sur votre ordinateur
- Le mineur de courrier électronique qui va aller chercher les courrier électronique et leur contenu dans Evolution.

Tracker 0.8 : première version stable

Avec la version 0.8, qui sera la prochaine version stable du moteur et qui devrait officiellement arriver mi 2010, on devrait voir arriver de nouvelles fonctionnalités, notamment de nouveaux mineurs :
- Le mineur rss : qui, comme son nom l’indique, permettra d’aller chercher dans le contenu Rss
- Le mineur internet : qui permettra de garder les informations sur les pages visités et de les retrouver facilement
- D’autres mineurs liéés aux services en lignes (Réseaux sociaux, documents en ligne, etc…)

Enfin le système devrait être encore optimisé vers une meilleure prise en compte des standards de bureau sémantique. Cette version est d’autant plus importante qu’elle pourrait être incluse dans Gnome comme projet officiel. La version 0.7 n’a été accepté qu’a titre de dépendance externe dans gnome 2.30. En cause, l’absence d’une version stable moderne, et le manque de maturité du projet.

Enfin l’équipe de Tracker travail en étroite collaboration avec l’équipe de Zeitgeist. Ce dernier projet permet de garder une trace des actions effectués par l’utilisateur dans le temps, sur les fichiers ou les applications.

Quelques liens :

- Site du projet
- Site du projet sur Gnome
- Blog d’un des développeurs

  1. lykhead
    19/03/2010 à 04:11 | #1

    merci seb ;o) mais je me demande quel est l’intérêt de tracker a l’avenir dans le projet gnome (mais pour xfce ou encore lxde), a moins qu’il ne sépare le moteur de l’interface. enfin depuis le temps que le projets avait bessoin de repartir sur des bases saine. c’est une excellente nouvelle.

  2. 19/03/2010 à 10:09 | #2

    L’idée derrière tout cela est excellente mais il manque le point de départ : Comment je fais pour associer ces métadonnés avec mes fichier? Pour certains format cela existe déjà (mp3) mais pour d’autres ce n’est même pas standardisé et tout les logiciels ne les gèrent pas de la même manière (tag dans les EXIF des photos par exemple) et pour la majorité des fichiers ça n’existe même pas.

    Tant que je ne pourrais pas tagger mes fichiers directement dans la boite de dialogue « enregistrer sous » l’utilité sera réduite.
    De plus il est important que ce système de marquage soit disponible pour toutes les applications il faut donc veiller à ce que tout repose sur des standards. Prétendre que sous prétexte que le code est ouvert tout le monde peut l’intégrer n’est pas suffisant.

  3. seb24
    19/03/2010 à 11:27 | #3

    Pour le coup je crois que je vais devoir faire un nouvel article à ce sujet. Car je me rend compte qu’il manque des explications au sujet de l’intégration.

    Tracker, c’est le moteur et les mineurs d’information. Bref y’a pas d’interface graphique. Ensuite y’a des modules qui viennent s’ajouter pour pouvoir interagir.

    Par exemple y’a un module Nautilus et Totem. Mais ils datent un peu et je pense qu’il faudra attendre un peu pour avoir une meilleur intégration (j’ai pas réussi à faire fonctionner les modules existants). Le seul module qui fonctionne réelement pour le moment c’est l’applet du Bureau Gnome.

    Je ferais un second article à ce sujet pour compléter le premier. ;)

    @LordPhoenix : Justement les devs de Tracker proposent une API. Ensuite l’objectif est que chaque logiciel puisse l’utiliser, et par exemple l’utilisation de requête SPARQL permet à d’autres applications de communiquer facilement avec l’API Tracker.

  4. FabriceV
    19/03/2010 à 12:16 | #4

    Bon, toujours un avis un peu désabusé… (mais je me soigne).
    Le moteur ben oui, il en faut un. Mais si:
    - l’attribution de mots-clés est contraignante, flop.
    - les mots clés ne sont pas sauvegardés au sein des fichiers, flop.
    - l’interface ne permet pas de filtrer rapidement les résultats, flop.
    - le classement des résultats n’est pas pertinent, flop.
    - l’interface ne permet pas d’afficher de longue liste de résultat, flop.
    - l’interface ne me permet pas de naviguer rapidement dans de longue liste, flop.
    Alors, on est toujours à des années d’avoir une recherche fonctionnelle sous linux, moteur ou pas.

    De plus, le bureau sémantique est souvent vendu avec la rhétorique suivante: avant vous trouviez ceci, mais là en plus, vous trouvez ceci, et cela, et ça… Mais demeurent fondamentales, les questions de la précision et des règles associées de classification et de présentation. Ex: je cherche « endurance » dans mes 5000 articles pdf… Actuellement, Tracker est capable de me placer en tête de gondole des articles qui ont « endurance » dans la bibliographie, avant les articles qui ont endurance dans le nom de fichier… Les mots clés par eux-même ne résolvent que peu de cas…

    De plus il est souvent d’abord postulé l’inorganisation des fichiers pour ensuite vendre la recherche relationnelle. Mais si mes vidéos sont dans le dossier vidéo, et mes photos dans le dossier photo quel est l’avantage? Et lorsque je recherche un fichier, je sais si je recherche une vidéo, une photo, un ficher openoffice ou un pdf… Tout cela est présenté comme si nous faisions des recherches sur un ordinateur qui ne nous appartenait pas et des fichiers que nous ne connaissions pas, dans un contexte ou nous ne saurions pas avant de faire la recherche ce que nous recherchons…

    Je ne nie pas l’avantage du bureau sémantique, je dis juste que très loin d’être la panacée universelle, et que sans interface (et donc sans doute dans un premier temps) cela sera même contreproductif pour ceux qui ont réellement des fichiers à rechercher…

  5. seb24
    19/03/2010 à 12:36 | #5

    Tu as installé quelle version FabriceV ?

    Pour Tracker en effet ca reste encore basique. Mais la version 0.8 qui doit arriver cette année devrait commencer à apporter un résultat plus intéressant. Pour ce qui est des interfaces, pour le moment la majorité date d’il y’a deux ans. Bref tout reste à faire.

    Il me semble qu’il pourront aller chercher des infos et les modifier directement dans les fichiers. Il y a des standards pour ça justement.

    Pour ce qui est de l’avantage du Bureau sémantique, il faut plus le voir comme un outil de recherche universel. Par exemple le but c’est pas forcement de rechercher des vidéo via un moteur de recherche principal. Mais de pouvoir chercher facilement tes vidéos dans ton lecteur de vidéo.

    A plus long terme il y a aussi l’idée de se passer de l’arborescence des répertoire qui n’est pas forcement naturelle.

  6. FabriceV
    19/03/2010 à 14:58 | #6

    tuxradar.comJe suis d’accord avec ton analyse à long terme, mais je considère que cela demeure un avantage potentiel, et qu’il faudrait finalement peu pour que beaucoup d’utilisateurs ne se retrouvent absolument dans ce fonctionnement.
    L’avantage peut se traduire par un changement de comportement : je passe mon temps à étiqueter les fichiers plutôt que de les ranger. (ce n’est pas de l’humour… quoique…). Je pense juste que pour profiter de ces évolutions, il faudra vraiment plusieurs années et être adaptable à un maximum d’utilisation. Dans l’opposition classique ranger vs étiqueter, étiqueter peut supplanter le rangement, mais si je veux donner à un professionnel tous mes articles étiquetés « endurance », je dois pouvoir physiquement déplacer ces fichiers (et être certain que le fichier sur l’endurance sexuelle n’est pas joint (là c’est de l’humour).
    Personnellement, je vois plus un avantage fonctionnel et ponctuel. Tous les fichiers qui me servent sur l’article x peuvent être étiquetés en conséquence, mais les articles demeurent rangés dans leurs dossiers respectifs.

    Je n’ai pas testé la version 0.8 de Tracker qui demeure classée instable. Entre sa limite du nombre affiché de fichiers, et la classification médiocre des résultats j’ai toujours abandonné. En plus la version 0.7 finissait toujours par planter l’index (même en ajustant les préférences) et ne même pas me renvoyer les fichiers, même quand le terme figurait dans le nom des fichiers. Je rejoins l’avis de tests comparatifs publiés dans les blogs: Recoll est la meilleure solution. Mais l’interface est loin d’être esthétique et ergonomique.
    Pour info : http://www.tuxradar.com/content/best-linux-desktop-search-tools
    Il y a aussi le méconnu Scan, mais plus il évolue, moins je le trouve fiable ce qui finit par être un problème (mais pas retesté la dernière version). http://scan.sourceforge.net/

  7. feuloren
    24/03/2010 à 00:12 | #7

    @FabriceV : Tracker 0.7 (ou 0.8) ne doit pas être considéré seulement comme un moteur de recherche dans tes fichiers, bien sûr l’outil de recherche sera toujours présent et a été amélioré (chaque propriété (titre, contenu) d’un fichier a un poids qui est utilisé pour trouver les résultats les plus pertinent). Mais Tracker 0.8 est surtout un « dépôt sémantique », c’est à dire qu’il peut être utilisé par n’importe quelle application pour obtenir du contenu : ex le gestionnaire de photo Solang utilise Tracker pour obtenir une liste de photo ce qui fait que tu n’as pas besoin d’importer tes photos comme avec F-spot. On peut aussi imaginer un lecteur de musique fonctionnant sur le même principe… Et les fichiers peuvent êtres liés à un contact, étiquetés.
    Je parle seulement des fichiers mais Tracker peut aussi stocker des contacts, des tâches à faire, des notes…

    Il y a un projet google summer of code de Gnome qui consiste à créer un dialogue d’ouverture/enregistrement de fichier basé sur le type de fichier et ses métadonnées plutôt que sur l’arborescence des dossier.

  8. FabriceV
    24/03/2010 à 13:21 | #8

    Il y a toujours un écart entre ce qui est sensé être fait et ce qui est fait. Je suis bien placé pour le savoir… Pour l’instant, le résultat n’est pas encore là, et les gains relèvent plus de la propective que de la réalité. Le plus inquiétant pour moi, ce n’est pas l’approche générale qui est parfaitement légitime, c’est de voir comment il semble être fait abstraction des défauts et du coût fonctionnel de ce genre d’approche.
    Je m’explique, j’ai lu combien de fois que le système hiérarchique conduisait à la perte de fichiers par l’utilisateur dans une hiérarchie obscure de dossiers. Je suis parfaitement d’accord.
    Mais qui a expliqué qu’un fichier mal étiqueté et « perdu » dans un dossier contenant des milliers de fichiers (puisque autant ne pas ranger) n’est pas plus retrouvable…
    Selon ton exemple j’utilise Tracker pour retrouver ce fichier… Tracker qui va consciencieusement me placer tous les fichiers correctement étiquetés en premier. Fidèle à l’esprit Gnome (qui semble avoir de plus regagné du poil de la bête) je n’aurais bien sûr (quelle horreur d’ergonomie) aucun bouton, aucune préférence pour demander à Tracker de na pas tenir compte des mots-clés. Conclusion : je n’ai qu’à chercher entre la 120e et la 180e position pour voir si je trouve par hasard le fichier que je ne sais même pas oû chercher…
    Étiqueter ne sert à rien si les outils ne sont pas développés pour permettre la manipulation des critères de filtres. S’il n’y a pas des outils pour visualiser dynamiquement les listes de fichiers en fonction des mots-clés, type, et emplacement et d’une recherche sur le contenu ou le titre (cf gestion des fichiers musicaux). Zotero ou Jabref sont des bons exemples d’interface faite pour trouver des références scientifique parmi des milliers : mots-clé, tri par colonne, recherche, dossier dynamique, ajout-retrait des mots-clé par simple clic, frise historique…

  9. 06/04/2010 à 16:40 | #9

    Pour l’instant j’ai bien l’impression que les tags ne peuvent être que des mots et pas des groupes de mots. Sur mon poste tracker trouve mes tags F-spot mais « enterrement de vie de cercueil » implique que dans tracker j’ai un tag « de » et un tag « cercueil ». J’espère que ce genre de chose est prévu a long terme…

  10. feuloren
    06/04/2010 à 23:28 | #10

    @yeKcim: le nom d’un tag est une chaines de caractères donc tu peux nommer un tag (étiquette en bon français) comme tu veux.
    Par contre il est possible que l’importateur des tags de F-spot ait des problèmes.

  11. ratoune
    07/04/2010 à 21:34 | #11

    Bonne nouvelle pour Tracker! Espérons qu’il répondra aux attentes, car effectivement, ce moteur décevait. Personnellement, après avoir abandonné Tracker, tenté Beagle, je suis passée finalement à Recoll qui me contente: il inclut en particulier des types de fichiers que j’utilise en masse (Lyx), ce que je n’ai jamais réussi à faire avec les 2 autres… Avec des options de filtre qui me sont bien utiles. Mais il est certain qu’il n’est pas franchement intégré à Gnome!
    Par contre, à ma connaissance, recoll ne gère pas les tags des photos?

  1. Pas encore de trackbacks