K3b

K3B logo (logiciel libre KDE)K3b est un logiciel libre de gravure pour CD et DVD fonctionnant sur les systèmes d’exploitation GNU/Linux et autres Unix. Il fait partie de KDE. Il fournit une interface graphique pour la gravure des CD/DVD, comme créer un CD Audio à partir d’une liste de fichiers musicaux, ou copier un CD. Le programme a de nombreux paramètres par défauts qui peuvent être modifiés. La gravure des CD dans K3b est actuellement effectuée à l’aide des logiciels en lignes de commandes : cdrecord, cdrdao et growisofs.

À son premier démarrage, il vous est demandé de confirmer la vitesse de gravure CD.

Activer l’overburning

Tout de suite, il faut procéder à un petit règlage dans le menu Configuration -> Configurer K3b et s’assurer d’être dans la section Gravure. Cliquez sur l’onglet Avancé. Il faut ensuite cocher la case Utiliser l’overburning. Cette fonction permet de gagner quelques Mo sur un CD au-delà de sa capacité.

Il faut ensuite quitter en appliquant pour se retrouver sur l’interface principale.

Graver un CD/DVD de données

Cliquez sur le bouton CD Données ou DVD Données selon le support que vous avez en main. Une boite s’ouvre.

L’écran est scindé en deux parties. En haut, se trouve le navigateur de l’arborescence de votre disque dur qui vous permet d’aller chercher le fichier que vous voulez graver. Dès que vous avez trouvé votre ficher, il suffit de faire un glisser-déposser sur le bas de la fenêtre qui correspond au cd/dvd de donnée. Vous faites de même avec tous les fichiers que vous voulez mettre sur le cd/dvd en prenant soin de ne pas dépasser la taille du disque. Pour vous indiquer où vous en êtes, tout en bas vous verrez une barre de progression verte. Plus elle va vers la droite, plus le support se rempli. un indicateur renseigne sur le nombre de Mo utilisé et restant. Quand vous avez fini, il faudra cliquer sur Graver (Burn).

Vous avez le choix de laisser les options par défaut, ou de les modifier comme vous le désirez. Pour donner un nom à votre support, il faut se rendre sur l’onglet Descrition du volume. Lorsque tout est prêt, cliquer de nouveau sur Graver (Burn). La gravure prendra de 5 à 20 minutes environ selon le volume de donnée et la vitesse de gravure selectionné.

Graver un CD audio

Si vous voulez graver des mp3 et les garder au format MP3, il faut choisir le bouton Graver un Cd/Dvd de donnée. Par contre, pour écouter des fichier MP3 sur n’importe quelle platine CD, il faut cliquer sur Graver un CD audio.

Comme pour Graver un CD/DVD de données, vous devez utiliser le glisser-déposser sur le bas de la fenêtre qui correspond au cd audio. Le MP3 sera alors automatiquement converti en fichier « classique ». Cliquer ensuite sur Burn, puis de nouveau sur Burn.

Contenu disponible sous GNU Free Documentation License.

Wine

Wine HQ is Not an emulatorWINE est l’acronyme récursif anglophone de « WINE Is Not An Emulator », littéralement WINE n’est pas un émulateur. Parfois, à tort, on le considère comme l’acronyme de « WINdows Emulator ». Ce logiciel est une implémentation libre de l’interface de programmation Microsoft Windows bâtie sur X et UNIX (BSD, GNU/Linux), c’est-à-dire qu’il permet d’utiliser sous GNU/Linux des programmes conçus pour fonctionner sous Windows. Le logiciel n’a donc pas besoin du système d’exploitation Windows pour fonctionner. En cela, WINE se différencie des émulateurs comme QEMU et Bochs. WINE gère les modes 16 et 32 bits de l’interface Windows. WINE est maintenant sous licence LGPL, après avoir été sous licence WineHQ, puis X11.

Mythes et réalités

« Wine est lent, car c »est un émulateur. » Comme son acronyme le souligne, Wine n »est pas un émulateur. Wine n »émule pas Windows : il est une implémentation de l »interface de programmation Win32. Même si en théorie les programmes devraient tourner légèrement plus lentement que sous Windows, les programmes Win32 bien codés fonctionneront plus rapidement et efficacement que certains programmes pour Linux mal codés !

« Wine, c »est nul, car on a besoin de toute façon de Windows pour le faire marcher ! » Wine n »a pas besoin d »une quelconque version de Windows pour fonctionner. Il peut se servir d »une installation de Windows pour trouver certains composants si Windows est installé dans votre ordinateur, mais ce n »est pas obligatoire. En n »utilisant aucune version de Windows, Wine installe ses propres composants et crée un faux environnement Windows dans lequel s »installeront les logiciels de votre choix. Les logiciels évolueront dans cet environnement simulé.

« Avec Wine, j »aurai accès en écriture à mes partitions NTFS. » Réponse courte : Wine ne permet pas la gestion en écriture de volumes NTFS. Réponse plus développée : Wine exploite les ressources du système d »exploitation dans lequel il est installé. Par défaut, GNU/Linux ne peut pas écrire sur les partitions NTFS ; Wine ne le pourra pas plus. Toutefois, si vous activez la gestion de volumes NTFS d »une quelconque façon (à l »aide de Fuse, du pilote Captive-NTFS ou du pilote natif en développement), Wine, comme tout autre logiciel natif sous Linux, pourra gérer les partitions NTFS.

« Je pourrai lancer des programmes Win32 sur mon Ubuntu installé sur mon Mac. » Wine ne fonctionne que sous les architechtures compatibles x86. Il ne fonctionne donc pas sous les ordinateurs Macintoch à base de processeurs PowerPC. Toutefois, la nouvelle génération de Mac étant basée sur des proceseurs Intel, ceux-ci pourront faire tourner Wine. (De ce fait, on peut même espérer que Wine pourra faire tourner éventuellement des logiciels pour Macintoch sur d »autres systèmes d »exploitation.)

Installation par Synaptic/Kynaptic

En utilisant l »application Synaptic pour Ubuntu et Kynaptic pour Kubuntu, recherchez le paquet wine (s »il est absent de la liste il vous faut activer les dépôts universe) et sélectionnez-le.

Configuration

En utilisant Winecfg depuis la ligne de commande (Terminal) :

$ winecfg

Une fenetre s’ouvre avec differents onglets.

Liens externes

Contenu disponible sous GNU Free Documentation License.

Un Panneau Solaire Par Enfant

One Solar Panel Per Child

(Un Panneau Solaire Par Enfant)

Silva.se Large solar panel

Le projet « One Solar Panel Per Child » requière 100 milliards d’euros sur 10 ans pour vendre des panneaux solaires portables à 33% de la population mondiale.

télécharger le fichier au format pdf

Situation actuelle

Les activités humaines rejettent une importante quantité de CO2 résultat de la combustion du pétrole. Bien que la moitié soit recyclée par l’atmosphère, l’autre moitié y reste, ce qui augmente l’effet de serre. Cette abondance de Gaz à Effet de Serre (GES) est à l’origine d’un réchauffement climatique.

Si le réchauffement continue au rythme actuel, il peut en résulter des modifications de la circulation des océans, un changement du climat catastrophique, une perte de biodiversité et des dommages irréversibles sur l’agriculture dans les écorégions les plus affectées.

Des estimations reconnues par le GIEC et par certains groupements d’assurance élèvent à 3,5 milliards le nombre de personnes qui pourraient être touchées par des pandémies, la disparition de sources d’eau potable et d’autres impacts possibles.

Ces gaz à effet de serre fonctionnent donc comme une couverture qui maintient une température chaude à la surface de notre Terre et l’empêchent ainsi de se refroidir.

Or, le charbon et le pétrole sont des énergies fossiles qui sont condamnées à disparaître si on les utilise plus vite qu’elles ne se forment. En 2015, le pétrole restant deviendra de plus en plus difficile à extraire. Il faut donc prévoir d’autres modes de consommation de l’énergie comme par exemple l’énergie solaire photovoltaïque.

Solutions

L’énergie solaire est l’énergie contenue dans le rayonnement solaire, direct ou diffus. Grâce à divers procédés elle peut être transformée en une autre forme d’énergie utile pour l’activité humaine, notamment en électricité et en énergie thermique.

La société AMD, un fabricant de microprocesseurs, et ses partenaires prévoient de fournir 2 milliards de Personal Internet Communicator (PIC) dans les dix prochaines années aux populations défavorisées dans le cadre de l’initiative 50×15.

OLPC laptopDe même, l’ordinateur portable du MIT Media Lab est un projet de recherche du MIT Media Lab ayant pour but de développer un ordinateur portable peu cher (à 100 USD), pour permettre à chaque enfant dans le monde l’accès à la connaissance et aux formes modernes d’éducation. Ce projet est développé par l’organisation One Laptop Per Child (un portable par enfant).

Or, cette population n’a pas encore accès à l’électricité. C’est pourquoi, la vente de panneaux solaires portables / nomades serait un moyen de remplacer les énergies fossiles, limiter le réchauffement de la planète, permettre aux populations d’accéder à l’électricité et donc, leur facilité l’accès aux ordinateurs portables et à l’internet.

Restrictions

Les Performances

cellule photovoltaïqueSi le panneau solaire est directement orienté vers le soleil, il fonctionne à 100 %.

Si le ciel partiellement couvert, la perte s’élève à environ 50%. Le panneau fonctionne donc à 50 % de son potentiel.

Si le ciel est couvert, il ne fonctionne plus qu’à 10 %. Ce qui équivaut à une perte de 90%.

Les techniques pour capter directement une partie l’énergie solaire sont disponibles et sont constamment améliorées. La recherche est très active dans le domaine du solaire photovoltaïque.

Les prix diminuent constamment et les rendements progressent.

En 20 ans, les rendements sont passés de 15% à 36% dans les laboratoires. Ce dernier chiffre serait celui atteint sur Terre par les cellules solaires utilisées par les robots martiens. Les rendements des systèmes disponibles commercialement sont quant à eux passés de 5% à plus de 20%.

En 2003, les nouvelles installations ont représenté, dans le monde, une puissance de 574 MW-pic, en augmentation de 34% par rapport à 2002. Financièrement, il s’agit maintenant d’un marché de 4 milliards d’euro par an. Le Japon, l’Allemagne et les États-Unis représentent ensemble 75% du marché mondial. Les installations connectées aux réseaux (sans stockage de l’électricité) représentent la majorité des nouvelles installations.

Les systèmes de production d’énergie solaire ont un coût proportionnel quasi-nul : une fois l’installation de l’appareil effectuée, l’énergie est produite par le Soleil, ce qui ne coûte rien. Il faut cependant tenir compte des coûts d’entretien de l’appareil.

Utilisation

Il est également possible de se servir d’un panneau solaire à l’intérieur d’un bâtiment. Seulement, les performances diminuent de 10 à 25% lorsque les rayonnements passent aux travers d’une vitre.

Facteurs environnementaux

atlas solairesituation géographique : Les pays qui seront choisi en priorité seront ceux dont la situation économique est la plus fiable.

condition météorologique : Les panneaux solaires doivent resister à l’eau, au froid et au choc. (à compléter)

rayonnement solaire saisonnier : Selon l’importance de la couverture nuageuse de l’atmosphère, le sol reçoit de 68 % jusqu’à 28 % (ou moins) du rayonnement solaire parvenant sur Terre.

La clientèle

Sur 6 milliards d’être humain, 1 milliard de personnes seulement ont accès à l’internet. Or, ce média devrait être accessible à tous. Il reste donc 5 milliards de clients potentiels.

L’Asie, l’Afrique et l’Europe totalise à eux seul 82,9 % de la population mondiale. C’est pourquoi, les pays qui les composent reste une des priorités du projet.

Agir

Créer une structure

Choisir sa forme juridique :

Pour une entreprise : contacter des business angels.

Pour une association loi 1901 : vérifier qu’il n’existe pas déjà une structure similaire dans votre ville. Sinon, déposer les status auprès de votre préfecture ou sous préfecture du département ou est situé votre siège social.

Aller sur le site de l’APCE, l’agence pour la création d’entreprises : http://www.apce.com/

Demander des subventions

Remplir un dossier de demande de subventions à votre mairie à l’aide de ce document ainsi que des status de votre organisme d’affiliation.

Voir sections financement et bugdet.

Plan d’Action

Première phase : Démonstration

1. acheter un panneau solaire (section équipe -> fournisseurs)

2. vérifier que le système fonctionne

3. en faire la démonstration à son entourage

Deuxième phase : Commercialisation

1. créer son organisation

2. prendre les commandes des clients, encaisser l’argent, passer commande

3. embaucher du personnel, monter une équipe

Troisième phase : Financement

1.faire des demandes de subventions

2.externaliser : créer d’autres communautés locales, régionales, nationales et internationales.

3.relancer la phase de Commercialisation

Quatrième phase : Recherche et développement (R&D)

1. expliquer comment assembler un panneau solaire

2. expliquer comment utiliser un panneau solaire

3. partager nos savoir-faire aux autres organisation via internet (Tout les travaux des membres de l’association « One Solar Panel Per Child » seront publiées sous licence libre.)

4. construire des prototypes

5. améliorer les rendements

6. relancer la phase de commercialisation

Financement

Le financement se fera par la vente directe sur internet ou par téléphone. Ce qui diminue très fortement tout risque d’impayé et optimise la trésorerie de l’association.

L’association peut recevoir des financements d’institutions publiques, de structures associatives déjà en place ainsi que d’institutions privé et de la société civile.

Comment contribuer ?

Ce projet se place dans l’initiative 50×15 puisqu’il vise à ce que la moitié de la planète est un chargeur solaire ainsi qu’un ordinateur portable qui fonctionnera aux énergies renouvelables avant 2015.

En lisant ce document, en achetant des panneaux solaires ou/et en reversant une partie de vos bénéfices à l’organisation « One Solar Panel Per Child » sous forme de don en nature ou de cotisations, vous contribuez déjà à la réussite de ce projet. Et je vous en remercie.

Budget

Le but est que 2 milliards de personnes achète un chargeur solaire portable à 50 euros (ou moins).

Le budget requis est de 100 milliards d’euros.

Un chargeur solaire portable vaut 50 euros. Si on achète 2 milliards de chargeur solaire portable et qu’on les vend à 51 euros, on obtient 2 milliard d’euros de bénéfice.

En prenant en compte les économies d’échelle, si le chargeur solaire portatif est vendu moins cher, donc à 48 euros, le bénéfice par objet est de 3 euros, le bénéfice total s’élève donc à 6 milliards d’euros.

Impact

Le projet a reçu également des critiques concernant l’impact sur la santé et sur l’environnement notamment à cause des composants utilisés lors de la fabrication de ces ordinateurs.

Impact humain

Quels sera l’impact d’une implantation massive de panneaux solaires portables fournissant des énergies renouvelables pour la population mondiale ?

Compte tenu du fait que le projet aurait un impact écologique non négligeable, l’OLPC a fait valoir qu’ils utiliseront autant de matériaux écologiques qu’ils pourront ; et que les portables et tous les accessoires seront compatibles avec la directive RoHS. Les ordinateurs portables utiliseront également moins d’énergie comparativement aux portables disponibles aujourd’hui (2006), réduisant par la même leur impact destructeur sur l’environnement. (source : olpc faq)

En France, l’électricité est loué à EDF. Alors que financer les énergies renouvelables coûte moins cher.

Démonstration : Un ordinateur coûte 12,74 euros d’électricité par an en moyenne. Donc, sur 20 ans : 254,8 euros. Acheter un chargeur solaire revient à 100 euros de frais fixes. Le placement devient rentable au bout de 10 ans. Cela fait donc une économie de 154, 8 euros par an. Tout les ans.

Ce projet vise à ce que la moitié de la planète est un chargeur solaire pour ordinateur portable qui fonctionnera aux énergies renouvelables avant 2015.

La gratuité des panneaux solaires est possible. Sur le bénéfice que ce fait les familles, 50% peut servir à financer d’autres familles en matériels. Donc, il est possible via contrat de « donner » des panneaux solaires portables sans que l’association verse quoi que ce soit.

Permettre aux populations d’accéder à une source d’électricité renouvelable, c’est d’une part réduire leur dépenses, d’autre part réduire la fracture numérique en leur donnant accès aux ouvelles Technologies de l’information et de la Communication (NTIC : téléphone, ordinateurs portables etc), faire entrer ses population dans la révolution numérique, enfin c’est permettre l’insertion de ces populations dans la société de l’information, les rattachant ainsi à l’économie mondiale.

Impact environnemental

Quel est l’étendue de l’empreinte écologique résultant de la création de 5 milliards de panneau solaire portable ? Cela représente une pollution non négligeable. Cependant, cela représente moins que la consommation de pétrole et ne génèrera pas de déchets radioactifs.

L’aptitude généralement admise veut que « Plus le niveau de vie est élevé, plus l’empreinte (et donc la consommation de ressources) est importante. » Cela est dangereux si les ressources utilisés ne sont pas durables, or les ordinateurs portables seront alimentés par le soleil qui est une énergie renouvelable.

Une population qui a accès à un niveau d’éducation élevé aura la possibilité de faire de meilleurs choix qu’une population avec un niveau d’éducation plus faible. Donc, si elle choisi le moyen d’existence le plus écologique, elle produira moins de déchets et son empreinte écologique sera par-la-même réduite.

Exemples :

* Meilleur choix en matière de transport : avoir un ordinateur chez soi évite qu’une personne habitant à la campagne n’est à se déplacer en voiture dans la ville la plus proche pour se connecter à un cybercafé.

* Meilleur choix en matière de chauffage : une LED plutôt que du kérosène pour s’éclairer, produit un impact moindre sur la planète. (source : lutw)

La vrai question est : quels sont les matériaux entrant dans la composition des panneaux solaires et des ordinateurs portables, et sont-ils durable?

Agents

Caractéristiques du Portable à $100 du MIT Media Lab

Un processeur, AMD Geode GX2-533@1.1W, controleur graphique intégré

Fréquence CPU: 400 Mhz

Compatible: X86/X87 – MMX, 3DNow!

Chipset: AMD CS5536 South Bridge

Un écran plat SVGA d’une diagonale de 7,5″ transmissif et réflectif :

En mode transmissif Couleur/DVD avec une résolution de 693 par 520 pixels avec rétro-éclairage (pour une utilisation en tant qu’ordinateur portable).

En mode réflectif (utilisant la lumière ambiante) monochrome d’une résolution de 1200 par 900 pixels (pour lire des « ebook » (Livres électroniques) à l’extérieur).

128 MB de DDR266- 133 Mhz DRAM.

512 MB de mémoire flash.

Réseau Sans Fil 802.11b (WiFi) fourni par une carte fonctionnant à une vitesse limitée (2 Mbit/s) pour minimiser la consommation électrique.

Clavier conventionnel alphanumérique localisé selon le pays d’utilisation.

Pavé tactile (touchpad) pour le contrôle du pointeur et comme zone d’entrée d’écriture manuscrite.

Deux hauts-parleurs.

3 Ports USB.

Sources d’alimentation :

Câble électrique servant également de bandoulière.

Deux piles rechargeables C (R14) ou D avec une manivelle.

Quatre piles alcalines C (LR14) ou D (LR20).

(A compléter)

Panneaux solaires

Il existe déjà des solutions pour téléphone mobile, MP3, PDA et GPS présenté par ces fournisseurs :

Nom : Silva

taille (cm) : 18 x 14 x 15 cm

Poids (kg) : 0,3 kg

Sortie (Volt et Watt) : 12 Volts / 4.75W

Type : Polycrystalline

Couleur : Noir

Environnement : Weatherproof

Garantie (ans) : 2 ans

Modèle : Solar II – 12V Charger

Prix : 99 euros

Acheter : ici

L’ordinateur portable du MIT Media Lab, qui consomme au minimum entre 2 et 3 Watts, devrait fonctionner avec les panneaux solaires de Silva et de ICP Solar précédemment cité puisque il exige des performances moindres. [olpc wiki]

Au maximum, entre 5 et 10 Watts, alors qu’un ordinateur traditionnel consomme 20 Watts en moyenne.

Attention : il faut être muni d’un allume cigare mâle pour brancher les appareils !

Et ils en vendent justement sur RueDuCommerce :

* Adaptateur Voiture Notebook Power – Plane 250NCP (49,95 Euros)

Mais également sur koonect.com :

* Caliber Adaptateur Allume cigare 12 Volts ou 24 Volts – 1500mA – PS10 (25,90 Euros)

* Caliber Adaptateur Allume cigare 3V à 12 Volts – 1000mA – PS20 (14,90 Euros)

Ce qui nous donne un KIT SOLAIRE à 113,90 euros ( 99+14,90 ). L’objectif des force de ventes sera d’abord de réduire ce coût à 100 euros. Puis, la production et la recherche et développement aidant, à 50 euros. Puisque l’association deviendra son propre fournisseur en contrôlant toute la chaîne de production afin de réduire les coûts et améliorer la qualité.

Afin de fournir un KIT Tout-En-Un pour 100 euros comprenant l’ordinateur portable du MIT (50 euros) ainsi que le KIT Solaire (50 euros).

Partenaires

Le projet part du constat qu’un ordinateur portable du MIT Media Lab sans panneau solaire ne fonctionnerait pas, et qu’un panneau solaire sans matériels fonctionnant à l’électricité n’aurait aucune utilité.

* OLPC (email : niav AT laptop.org )

* AMD et son PIC (email : amd.50×15 AT amd.com )

* Simputer (email : simputer AT csa DOT iisc DOT ernet DOT in)

Références

Statistique mondiale de l’internet

Information et statistique sur les populations et les pays du monde

Simuler sa consommation électrique

Voir aussi :

mon site web

http://www.portail-solaire.com

Extra

Copyright (c) 2006 Geffrotin Yann.

Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled « GNU Free Documentation License« .

Photos appartenant à leur propriétaires respectifs.

Dernière révision : 18 août 2006

Ordinateur portable du MIT Media Lab

L’ordinateur portable du MIT Media Lab est un projet de recherche du MIT Media Lab ayant pour but de développer un ordinateur portable peu cher (à 100 USD), pour permettre à chaque enfant dans le monde l’accès à la connaissance et aux formes modernes d’éducation. Ce projet est développé par l’organisation One Laptop Per Child (un portable par enfant) [1].OLPC

Les ordinateurs ne sont pas une priorité

Selon le wiki anglais de l’OLPC :

« Il doit être mentionné qu’une critique commune du projet est de dire : « Les gens pauvres ont besoin de nourriture et de logements, pas d’ordinateurs portables. » Ce commentaire, souvent, est ignorant des conditions dans lesquelles se trouvent les pays en voie de développement de par le monde. Bien qu’il soit vrai qu’il y est beaucoup de personne dans le monde qui ont manifestement besoin de nourriture et de logements, il y en a aussi des multitudes qui vivent à la campagne ou dans les banlieues urbaines et qui eux, ont à manger en abondance et peuvent s’abriter raisonnablement. Ce que ces gens n’ont pas, c’est un moyen décent d’accéder à une bonne éducation. » [1]

Impact environnemental

Le projet a reçu également des critiques concernant l’impact sur la santé et sur l’environnement notamment à cause des composants utilisés lors de la fabrication de ces ordinateurs [4]. Compte tenu du fait que le projet aurait un impact écologique non négligeable, l’OLPC a fait valoir qu’ils utiliseront autant de matériaux écologiques qu’ils pourront ; et que les portables et tous les accessoires seront compatibles avec la RoHS. Les ordinateurs portables utiliseront également moins d’énergie comparativement aux portables disponibles aujourd’hui (2006), réduisant par la même leur impact destructeur sur l’environnement. [2].

Texte disponible sous GNU Free Documentation License.

Lucene

Lucene Logo Java open sourceLucene est une interface de programmation écrite en Java qui permet d’indexer et de rechercher du texte. C’est un projet open source de la fondation Apache mis à disposition sous Licence Apache et également disponible sous Ruby, Perl, C++.

Lucene sous SourceForge

Lucene est un moteur de recherche libre mis en téléchargement sous SourceForge en mars 2000 par Doug Cutting, et publié sous licence publique générale limitée GNU.

L’annonce de son transfert sous Jakarta a été publiée en octobre 2001.[2]

Lucene in Action

Le projet Lucene vient d’abord d’un livre publié en décembre 2004, Lucene in Action (Lucene en action), écrit conjointement par Erik Hatcher, un des responsables des projets open source Ant, Lucene et Tapestry, et par Otis Gospodnetic, un membre actif du projet Apache Jakarta.

Jakarta Apache

Le 14 février 2005, Lucene effectue sa migration vers le projet Apache Jakarta. La base de connaissance formant le code source a été converti au contrôleur de version SVN.

Lucene à l’ApacheCon

Puis le lundi 12 décembre 2005, Grant Ingersol présente un cas d’étude en Java à l’ApacheCon US sur l’utilisation avancé des composants de Lucene[3] en donnant notamment des détails techniques sur le traitement du langage naturel [4].

OpenSolaris propulsé par Lucene

Chandan, ingénieur sécurité chez Sun, a annoncé le 15 juin 2005 sur son blog chandanlog(3C) qu’il avait écrit un moteur de recherche simple en Java, OpenGrok et que « Lucene (avait) été choisi pour être la bibliothèque logicielle servant de noyau de recherche et d’indexation pour le code source, après avoir pris en considération toutes une variété de moteur de recherche et d’outils. » Complété par Exuberant Ctags qui serait utilisé pour extraire les définitions des fichiers sources. Ceci, afin de gagner du temps et d’explorer les millions de lignes du codes sources d’OpenSolaris [5].

Wikipédia propulsé par Lucene
Jusqu’à avril 2005, la fonction recherche de l’encyclopédie wikipédia était indisponible durant les heures de pointes. Dans ces cas là, il était recommandé d’utiliser le moteur de recherche externe Yahoo! ou Google.

Cependant, depuis l’annonce de Brion Vibber dans la liste de diffusion Wikitech, il en est tout autrement[5]. Cette annonce a été également reporté par Michael Snow environ une semaine plus tard dans le Wikipedia Signpost (équivalent anglais du Wikimag) [6].

Kate a écrit le programme en décembre mais celui-ci à été mis aux oubliettes à cause de la machine virtuelle Java qui n’est pas un logiciel libre. Le programme a donc été plus tard totalement réécrit en utilisant GCJ.

Utilisation de Lucene

Indexation

Jusqu’à l’explosion de l’internet, la Classification décimale de Dewey était très efficace pour catégoriser des objets dans une bibliothèque. Cependant, comme la somme des données collectée est devenu trop vaste, il nous faut utiliser des moyens alternatifs et plus dynamique de trouver de l’information.

Au coeur de tous les moteurs de recherche se trouve le concept de l’indexation : en traitant les données brutes en leur donnant de multiples liens hautement efficient, on facilite la rapidité de la recherche. En fait, le concept est assez analogue à l’index terminologique que l’on trouve généralement à la fin d’un livre, qui permet de trouver rapidement les pages qui traitent d’un sujet donné.

Si l’on a besoin de couvrir un large champs de fichiers ou de trouver une chaîne de caractères précise dans un seul fichier, il ne faut pas scanner séquentiellement chaque fichier pour la phrase donné. Car, plus le nombre de fichiers est grand, plus longue est la recherche d’information. Bien plutôt, il vaut mieux établir un index des textes dans un format qui permette la recherche rapide, éliminant par la même la méthode séquentielle.

Recherche

La recherche est l’action de regarder des mots dans un index pour trouver des références à des documents lorsqu’ils apparaissent. La qualité d’une recherche est évalué par le positionnement et la pertinance des résultats. Cependant, il faut aussi prendre en compte d’autres facteurs qui entre en compte dans une recherche. La rapidité, tout d’abord, est un facteur déterminant pour traiter une vaste quantitée d’information. De même, pouvoir supporter des requêtes simples ou complexes, des interrogations de phrases, des caractères, les résultas de positionnement et de tri sont aussi importants qu’une syntaxe facile à prendre ne main pour entrer ces requêtes.

Classes d’indexation

  • IndexWriter – La classe IndexWriter est le composant central du processus d’indexation. Cette classe crée un nouvel index et ajoute des documents à un index existant. On peut se la représenter comme un objet par lequel on peut écrire dans l’index mais qui ne permet pas de le lire ou de le rechercher.
  • Directory – La classe Directory représente l’emplacement de l’index de Lucene. IndexWriter utilise une des implémentations de Directory, FSDirectory, pour crée son index dans un répertoire dans le Système de fichiers. Une autre implémentation, RAMDirectory, prend toutes ses données en mémoire. Cela peut être utile pour de plus petit indices qui peuvent être pleinement chargé en mémoire et peuvent être détruit sur la fin d’une application.
  • Analyzer – Avant que le texte soit dans l’index, il passe par l’Analyser. Celui-ci est une classe abstraite qui est utilisé pour extraire les mots importants pour l’index et supprime le reste. Cette classe tient une part importante dans Lucene et peut être utilisé pour faire bien plus qu’un simple filtre d’entrée.
  • Document – La classe Document représente un rassemblement de champs. Les champs d’un document représente le document ou les métadonnées associées avec ce document. La source originelle (comme des enregistrements d’une base de donnée, un document word, un chapitre d’un livre etc) est hors de propos pour Lucene. Les métadonnées comme l’auteur, le titre, le sujet, la date etc sont indexées et stockées séparément comme des champs d’un document.
  • Field – Chaque document est un index contenant un ou plusieurs champs, inséré dans une classe intitulé Field. Chaque champs (field) correspond à une portion de donnée qui est interrogé ou récupéré depuis l’index durant la recherche.

Classes de recherche

  • IndexSearcher – La classe IndexSearcher est à la recherche ce que IndexWriter est à l’indexation. On peut se la représenter comme une classe qui ouvre un index en mode lecture seule.
  • Term – Un terme est une unité basique pour la recherche, similaire à l’objet field. Il est une chaîne de caractère : le nom du champs et sa valeur. Notez que les termes employés sont aussi inclus dans le processus d’indexation.
  • Query – La classe Query est une classe abstraite qui comprend BooleanQuery, PhraseQuery, PrefixQuery, PhrasePrefixQuery, RangeQuery, FilteredQuery, et SpanQuery.
  • TermQuery – C’est la méthode la plus basique d’interrogation de Lucene. Elle est utilisé pour égaliser les documents qui contiennent des champs avec des valeurs spécifique.
  • QueryParser – La classe QueryParser est utilisé pour générer un décompositeur analytique qui peut chercher à travers un index.
  • Hits – La classe Hits est un simple conteneur d’index pour classer les résultats de recherche de documents qui apparaissent pour une interrogation donné. Pour des raisons de performances, les exemples de classement ne chargent pas depuis l’index tout les documents pour une requête donné, mais seulement une partie d’entre d’eux.

Bibliographie

  • « Introduction to Apache Lucene: Construction of Java Open Source Full Text Retrieval Systems » by Koshi Sekiguti ; Gijutsu-Hyohron Co, Ltd; (ISBN 4774127809)
  • « Lucene In Action » par Erik Hatcher et Otis Gospodnetić; Manning Publications; Decembre 2004; (ISBN 1932394281)(en)[7]
  • Manfred Hardt, Dr. Fabian Theis: « Suchmaschinen entwickeln mit Apache Lucene« ; Software & Support Verlag, Frankfurt/Main, Germany; Septembre 2004; (ISBN 3935042450)

Liens externes

Texte disponible sous GNU Free Documentation License.

Nutch

Nutch logoNutch est une initiative visant à construire un moteur de recherche open source. Il utilise Lucene comme bibliothèque de moteur de recherche et d’indexation. En revanche, le robot de collecte a été créé spécifiquement pour ce projet.

L’architecture de Nutch est hautement modulaire et permet à des développeurs de créer des plugins pour différentes phases du processus: récupération des données, analyse des documents, recherche, etc.

Doug Cutting est l’initiateur et le coordinateur de ce projet.

Il est entièrement développé en Java, mais les données qu’il manipule sont dans un format indépendant de tout langage de programmation. En juin 2003 a été présenté une version opérationnelle d’une démonstration de Nutch sur une base regroupant 100 millions de documents.

L’Oregon State University passe à Nutch

Depuis septembre 2004 l’Oregon State University remplace son pôle de recherche Googletm par Nutch. Cela lui permet de réaliser des réductions de coûts significatives et de promouvoir la transparence de ce moteur de recherche. Cette réduction est estimée à 100 000 $ par an selon l’Open Source Lab ([1]).

CreativeCommons.org s’appuye sur Nutch

Creative Commons inaugure en 2004 une beta version de son moteur de recherche qui parcoure le web à la recherche de texte, de son audio et de vidéo, indexant à cette date un million de page ; tout cela réutilisable librement selon les termes des licences mis à disposition sur leur site web. [2]

Leur moteur de recherche s’appuie le Resource Description Framework (RDF) qui utilise le méta-langage XML , standardisé par le World Wide Web Consortium (W3C).

Cette sortie coïncide avec celle du navigateur Web Mozilla Firefox dans sa version 1.0 rendant par la même possible la recherche de contenu libre.

Nutch rejoint Apache

En janvier 2005, Nutch est un projet de deux ans d’âge qui a d’abord été hébergé par Sourceforge et soutenu par sa propre organisation à but non lucratif. Cette organisation a été fondé dans le but de donner un copyright au projet et de pouvoir garder le droit de changer la licence. L’équipe a décidé que la licence Apache était la plus approprié pour Nutch et qu’il n’avait plus besoin de l’aide d’une organisation extérieure. Les dirigeants et les développeurs sont maintenant soutenus par la fondation Apache.

Après cinq mois d’incubation, Nutch devient un sous-projet de Lucene.

Évaluation du moteurrobot nutch

Publiée le 1er juin 2004, l’étude menée par Lyle Benedict présente une comparaison des résultats du célèbre Google et de son homologue libre Nutch dans le cadre restraint du site internet de l’Université de l’état de l’Oregon sur une base de 100 requêtes ([2]). Pour exemple, sur des notes allant de 0 à 10 où 10 est la meilleure note, elle a trouvé 28 requêtes par lequelles Nutch et Google ont obtenu la note maximale.

Contributions

Les contribution sont basées sur le mérite et le karma. Les contributeurs doivent s’inscire à une liste de diffusion pour savoir qui fait quoi et envoyer un court mail informant les autres de ce qu’ils vont faire. Quand le travail est fini, le bout de code est soumi à la liste de diffusion (ou attaché à un rapport de bug) afin que chaque contributeur puisse examiner sa qualité et sa pertinence ([3]).

Les critères d’acceptations sont:

  • une haute qualité (du code);
  • facilité de lecture;
  • facilité d’intégration;
  • cohérence avec les objectifs de Nutch.

Si tout est correct, le bout de code est inseré par les développeurs dans la base des sources et il devient partie intégrante de Nutch.

Articles connexes

Bibliographie

  • A Search Engine for Natural Language Applications. Michael J. Cafarella, Oren Etzioni. Proceedings of the 14th International World Wide Web Conference (WWW 2005).
  • Thwarting the nigritude ultramarine: learning to identify link spam. Isabel Drost and Tobias Scheffer. Proceedings of the 16th European Conference on Machine Learning (ECML 2005).
  • Query Chains: Learning to Rank from Implicit Feedback. Filip Radlinski and Thorsten Joachims. Proceedings of the ACM Conference on Knowledge Discovery and Data Mining (KDD), ACM, 2005.

Liens externes

  • (fr) Kelforum – Un moteur de recherche basé sur Nutch et PeerFactor.
  • (fr) Misterbot – Un moteur de recherche généraliste francophone basé sur Nutch.

Texte disponible sous GNU Free Documentation License.