Google Print, mais comment ils font au juste ?

Merci à Clubic qui nous explique comment Google s’y prend pour numériser les millions de pages pour son projet Google Print. Pour ceux du fond qui n’auraient pas suivi, il s’agit de faire une sorte de giga bibliothèque en ligne, permettant à chacun de faire des recherches dans les livres. Pour cela, il faut "scanner" les pages des livres, ce qui représente une colossale somme de travail.

Allez donc voir ce dossier passionnant. Il vous permettra de voir comment se passe cette fameuse numérisation, via des machines ultra perfectionnées. Il nous éclaire sur les enjeux derrière cette polémique. En effet, quand on le voit sous l’angle de la conservation des archives, Google n’est plus le vilain pilleur des droits d’auteur, mais bel et bien le grand sauveur. Pas si simple comme débat, certes Google veut proposer du contenu gratuit, mais in fine, donner accès la culture, n’est-ce pas aider les auteurs en propageant leurs écrits et idées ?

La numérisation d’un support papier "brut" nécessite un nombre d’opérations et de manipulations incroyable : acheminement des ouvrages, leur stockage, passage dans les machines adéquates, transmission des données, vérification… Gageons que les process vont s’améliorer rapidement dans un proche avenir, car à la vitesse actuelle, on prévoit environ 300 ans à Google pour numériser l’intégralité des ouvrages présents sur cette terre !

Kirtas_2

Source : Ratiatum

Related posts:

  1. Google Chrome va 30% plus vite… mais à quand la version Mac?
  2. e-readers : pourquoi pas Google? Google Reader dans un objet dédié serait vraiment la killer app
  3. Google software
  4. Google Story
  5. Un entretien chez Google ?

Comments

  • http://www.alexis.blogs.com Alexis

    Merci Nicolas !!
    Extrêmement intéressant et enjeu considérable en effet

  • http://www.argentissimo.com comment

    quand je pense a tous ces livres accessibles a tous, je me dit: quel reve!

  • http://www.woueb.net Romain

    Mmm, en fait l’article en question parle d’Infotechnique (j’en parlais déjà ici : http://www.woueb.net/index.php/2005/11/01/93-nouveaute-google-google-catalogs) et non de Google. Le procédé à d’ailleurs été inventé pour Infotech.

    Infotechnique est la seule entreprise au monde qui peut numériser de façon industrielle à l’heure actuelle.

  • http://wunderbach.blogspirit.com Donatien

    300 ans ! héhéhé
    As-t-on prévu dans cette projection que nous écrirons d’autres ouvrages d’ici là…

  • http://nclairembault.typepad.com Nicolas

    Merci pour la précision.

    Infotechnique est peut-être le seul à maîtriser le process de façon industrielle, mais le nombre et la qualité des résultats de Google Books (c’est le nouveau nom) est tout de même impressionnant.