Google Code Search : les hackers lui disent (déjà ) merci !
Par netking,
dimanche 8 octobre 2006 à 12:41
::
Devzone
Alors que Google vient d'inaugurer son nouveau moteur de recherche spécialisé dans l'indexation des codes sources, des hackers ont déjà trouvé des moyens intéressants d'en tirer parti.

Le principe de Google Code Search est très simple : ce nouveau service indexe "l'intérieur", c'est à dire le code lui même, de tous les packages que les robots de Google trouvent sur l'internet.
Pour les non initiés, un package est une archive contenant tous les fichiers nécessaires à la compilation d'un programme. Généralement, un package contient les fichiers source dans un ou plusieurs langages (php, c, perl, etc.).
Bien évidemment, la logique de Google est d'apporter plus de simplicité à la communauté open-source dont les packages sont libres d'accès et modifiables (par exemple, le code de Dotclear, qui fait tourner ce blog est librement téléchargeable et modifiable).
Mais comme Tyoogle l'a déjà démontré pour la version standard de l'outil de recherche, la puissance des robots de Google est telle que l'indexation des packages met de nombreux développeurs de logiciels propriétaires à la merci du premier hacker venu.
En effet, il suffit de lancer une recherche avec le mot clé "this file contains proprietary" pour se rendre compte que Google propose plus de 100 000 liens vers des pages de code qui, pour la plupart, n'auraient jamais du se retrouver sur Internet.
On savait déjà qu'il fallait éviter de laisser des répertoires non protégés traîner sur un serveur, maintenant il faudra également faire très attention aux .tar.gz et autres .zip contenant du code...

Le principe de Google Code Search est très simple : ce nouveau service indexe "l'intérieur", c'est à dire le code lui même, de tous les packages que les robots de Google trouvent sur l'internet.
Pour les non initiés, un package est une archive contenant tous les fichiers nécessaires à la compilation d'un programme. Généralement, un package contient les fichiers source dans un ou plusieurs langages (php, c, perl, etc.).
Bien évidemment, la logique de Google est d'apporter plus de simplicité à la communauté open-source dont les packages sont libres d'accès et modifiables (par exemple, le code de Dotclear, qui fait tourner ce blog est librement téléchargeable et modifiable).
Mais comme Tyoogle l'a déjà démontré pour la version standard de l'outil de recherche, la puissance des robots de Google est telle que l'indexation des packages met de nombreux développeurs de logiciels propriétaires à la merci du premier hacker venu.
En effet, il suffit de lancer une recherche avec le mot clé "this file contains proprietary" pour se rendre compte que Google propose plus de 100 000 liens vers des pages de code qui, pour la plupart, n'auraient jamais du se retrouver sur Internet.
On savait déjà qu'il fallait éviter de laisser des répertoires non protégés traîner sur un serveur, maintenant il faudra également faire très attention aux .tar.gz et autres .zip contenant du code...
















Tutoriaux WI
