Yacy (https://yacy.net/) est un moteur de recherche qui utilise le p2p à installer sur son ordinateur.

Cela fait deux ans que j'ai commencé d'utiliser ce moteur de recherche, même si l'idée est bien, le probleme est d'une part que simplement pour rechercher il faut installer le programme, et pour crawler des sites et intégrer les résultats aux réseau de Yacy, c'est tres problématique, ca fonctionne pour quelques milliers de pages mais ca devient vite problématique.

Pour avoir de bons résultats, il faut l'installer sur un SSD dédié, et là aussi il y a d'étranges problemes, je l'ai installé sur un kingston de 1To externe, et branché sur une prise usb 3.1 avec un adaptateur ca ne machait pas, yacy ne se lancait pas, ou se chargeait indéfiniment. Sur une prise classique usb 3 avec un des deux adaptateur externe, là aussi yacy ne se lancait pas, pourtant le disque était visible et utilisable, ca posait probleme que pour yacy.

Autre probleme au bout de quelques millions de résultats crawlés, yacy devient intutilisable, plusieurs fois il ne se lance plus, se charge indéfiniment, on doit donc vider le dossier des résultats sur le disque et on relance, ou alors yacy ne répond plus il est lancé mais l'interface dans le navigateur ne se charge plus ou alors apres des heures d'attente...

Autre probleme pour crawler les sites on doit indiquer des urls ou un sitemap, mais pas les deux en meme temps, ni plusieurs sitesmaps pour un meme site, pareil pour les RSS on ne peut importer une liste de RSS mais ajouter qu'un seul à la fois, sans parler de la configuration, ultra compliquée et difficile à comprendre.

L'autre probleme est la mémoire, avec la config par defaut n'espérez pas crawler des millions de résultats, ce n'est que quand j'ai configurer yacy pour utiliser plus de 20go de mémoire qu'il fonctionne correctement sur ce point, j'ai meme pu mettre deux ou trois fois plus de sites à crawler sans augmenter la mémoire sans que yacy n'indique avoir stoppé à cause de manque de mémoire...