Etude sur le piratage numérique du livre : idées reçues, résultats, perspectives

Le 23 octobre 2009

Passionnante étude commanditée par le Motif et menée par Mathias Daval. Elle est disponible sur le site du Motif à cette adresse. Si le temps vous manque, vous pouvez lire la synthèse, mais je vous conseille de lire l'intégralité de l'étude déjà commentée sur La feuille, Ebouquin et reprise sur pas mal de sites, à en croire la revue de presse de Edysseus consulting, qui l'a menée.

dark

[Billet initialement publié par Silvère Mercier sur Bibliobsession, le blog d'un bibliothécaire bibliobsédé des bibliothèques, retrouvez moi sur twitter : Silvae !]

Passionnante étude commanditée par le Motif et menée par Mathias Daval. Elle est disponible sur le site du Motif à cette adresse. Si le temps vous manque, vous pouvez lire la synthèse, mais je vous conseille de lire l’intégralité de l’étude déjà commentée sur La feuille, Ebouquin et reprise sur pas mal de sites, à en croire la revue de presse de Edysseus consulting, qui l’a menée. Elle est importante cette étude parce que c’est la toute première étude française sur le sujet.

A sa lecture on ne peut qu’être frappé par le fait qu’elle appelle, en creux, un modèle nouveau pour l’ensemble des acteurs de l’industrie du livre et pour les politiques publiques menées autour des contenus… dont font partie les bibliothèques.

La comparaison est tout a fait possible avec la musique et le cinéma et on pourrait citer nombre d’analyses proposées par Guillaume Champeau de Numerama par rapport aux processus qui ont conduits du piratage massif à la remise en cause des DRM et au développement d’offres légales de bonne qualité (et encore), en passant par le prétendu manque-à-gagner pour les industries culturelles. Pourtant, la comparaison s’arrête là, tant les volumes sont différents. Le piratage numérique du livre en 2009, c’est une poignée de gens qui scannent illégalement du papier et passetn beaucoup de temps à des corrections et de la mise en page pour mettre à disposition des fichiers d’oeuvres qui ne sont majoritairement pas disponibles ailleurs !

Le piratage du livre aujourd’hui est donc tout sauf de la contrefaçon mafieuse à grande échelle. Ce côté obscur de la force peut d’autant plus facilement être considéré comme une zone grise, où le fait d’enfreindre le droit d’auteur est partieprenante d’un objectif qui n’a rien de pécunier. Et l’auteur de l’étude de citer ce message publié sur un forum par une équipe de pirates :

« Nous sommes une équipe dédiée à la création d’ebooks distribués via les réseaux Peertopeer. Sur ce modeste portail, vous pourrez trouver un forum de discussion, une liste à jour de nos distributions mais aussi des informations sur les techniques employées pour créer nos ebooks. Notre mission : Communiquer l’amour de la lecture et de la langue française à tous, au delà de l’éloignement ou du manque de moyens ! Nous ne sommes pas particulièrement portés sur une certaine catégorie de livres, mais faisons plutôt le choix de convertir en ebooks nos coups de coeur. Certains livres copyrightés et récents font partie de nos distributions, comme ce sont souvent ceux qui intéressent le plus grand lectorat. Nous pensons qu’un ebook ne saurait remplacer le livre lui-même, mais simplement donner envie d’aller plus loin avec son auteur(e). Bien entendu, si un ayant droit se pensait réellement lésé par l’existence d’un ebook issu d’un livre de son catalogue, nous cesserons immédiatement de le partager. »

Lionel Maurel rapporte ainsi l’exemple d’Enro amené à enfreindre le droit pour traduire le titre d’un auteur dont il était amateur. Cette étude est intéressante parce qu’elle invite à s’écarter d’une conception étroite du droit d’auteur, sans pour autant cautionner l’aspect clairement illégal de ces pratiques. C’est au prix d’un examen attentif de cet écart qu’une offre légale publique et privée de qualité pourra voir le jour !

Commençons par remettre en cause deux idées reçues pour clarifier le débat sur le sujet.

Idée reçue numéro 1 : les fichiers illégaux sont de très mauvaise qualité. C’est faux indique l’étude : les fichiers qui circulent sont majoritairement de très bonne qualité, proposés par des équipes restreintes et très organisées. En ce sens, sans faire évidemment l’apologie de ces pratiques, les pirates numériques du livre d’aujourd’hui ne sont rien d’autre que des internautes qui se sentent investis d’une mission, celle de soigneusement scanner, corriger, mettre en forme et partager des fichiers de bonne qualité, en pratiquant même entre équipes une certaine émulation… Oserai-je dire que ces gens sont du côté obscur de la même force qui motive bien des bibliothécaires ? :-) (oups, je l’ai dit, trop tard)

Idée reçue numéro 2 : Les ventes de fichiers numériques vampirisent les ventes de l’imprimé. Les expériences menées tendent à montrer, en restant prudent, que ce n’est pas le cas, mais qu’au contraire, la circulation des fichiers permet à une offre éditoriale de bénéficier d’effets de réseaux lui permettant de “sortir de l’obscurité”.

Extrait à l’appui :

Présentées en février 2009 à l’occasion du Tool of Change for Publishing Conference organisée par l’éditeur américain O’Reilly, deux expériences menées en 2008 par le cabinet de conseil Magellan Media ont étudié l’impact direct de la diffusion de livres sur le web :

D’une part, l’éditeur Random House a mis à disposition quelques titres gratuitement sur son site web : les ventes papier de ces titres ont augmenté en moyenne de 19,1 % pendant la période promotionnelle (par rapport aux ventes pendant les 4 semaines qui la précèdent), puis de 6,5 % pendant la période suivante. Notre étude montre que, si l’on ne peut en tirer de causalité stricte quant à l’impact d’une diffusion gratuite sur les ventes (puisqu’on ne spéculer sur le montant des ventes si cette opération promotionnelle n’avait pas eu lieu), en revanche elle peut affirmer que cet impact n’est en aucune façon négatif.

D’autre part O’Reilly a suivi certains de ses best‐sellers, vendus sans DRM* sur son site. Il a
observé la courbe de diffusion illégale de 8 titres piratés, et a constaté que leurs ventes
numériques ont augmenté globalement de 6,5 % dans les 4 semaines qui ont suivi la première apparition de seeds* (sources de fichiers illégaux) sur Internet
. Par ailleurs, l’éditeur a été surpris de constater le temps de latence existant entre la publication officielle et la diffusion pirate : 20 semaines en moyenne (avec un écart allant de 4 à 43 semaines selon les titres).

(…)

Une expérience similaire a été menée par un autre éditeur américain d’ouvrages informatiques, No Starch, en mars 2008. Un an plus tard, il n’est parvenu à aucune conclusion précise quant au lien entre la mise à disposition gratuite de leurs livres sur le web et l’évolution de leurs ventes. Ils sont en tout cas incapables d’y trouver un lien de causalité négatif, et ils demeurent partisans de cette méthode qui, selon eux, est efficace pour contrer le «bruit » généré par les milliers d’ouvrages qui sortent chaque année en librairie. L’idée est qu’un éditeur a tout à gagner à se faire connaître ainsi par le bouche à oreille sur Internet.

(…)

C’est aussi ce que souligne l’éditeur américain Tim O’Reilly en considérant que, du point de vue des éditeurs comme des auteurs, le véritable problème n’est pas le piratage, mais l’obscurité : comment faire sortir un ouvrage de la masse sans cesse grandissante des productions éditoriales ? Cory Doctorow, essayiste, auteur de science‐fiction et co‐créateur du blog Boing Boing, apporte un argument supplémentaire : « J’ai commencé à distribuer gratuitement mes livres lorsque j’ai été témoin des débuts de la scène « bookwarez ». (…) [Les] fans passaient facilement 80 heures pour pirater leurs livres favoris (…) J’ai considéré que c’était plutôt une bonne chose d’avoir à ma disposition 80 heures d’effort promotionnel gratuit. »

Ainsi, le numérique appelle un développement communautaire autour des contenus et permet d’autres usages de lecture, comme le rappelle Hubert Guillaud dans ce billet d’Internet Actu :

Les premières études sur les usages des livres électroniques montrent bien qu’on ne les utilise pas de la même façon que les livres papier. On pioche plus facilement des passages ou des chapitres plutôt que d’avoir une lecture linéaire. Sans compter qu’on n’a pas les mêmes usages selon les types de contenus qu’on consulte : on a plutôt tendance à télécharger certaines formes littéraires et à accéder en ligne à d’autres, comme l’expliquaient certains des spécialistes du secteur à la conférence TOC 2009.

Ces deux idées reçues montrent bien que le numérique a des complémentarités à trouver avec l’imprimé. Avant d’envisager les perspectives ouvertes, voici la synthèse des résultats de cette étude proposée par ses auteurs. Mes commentaires sont entre crochets :

Le téléchargement illégal des livres sur Internet n’est pas nouveau, mais il semble décoller depuis le milieu de l’année 2008 à travers le monde. Il reste toutefois un phénomène particulièrement mineur au regard des autres formes de piratage en ligne.

L’évaluation du nombre de livres disponibles en téléchargement illégal reste complexe. Mais on peut l’estimer, à l’été 2009, de 4 000 à 6 000 titres différents, dont 3 000 à 4 500 bandes dessinées. Soit moins de 1 % des titres disponibles légalement au format papier.

Pirater un livre en le scannant depuis sa version papier représente un travail fastidieux de 6 à 10 heures minimum pour un résultat de bonne qualité. Pourtant, 77 % des ouvrages atteignent ce niveau de qualité. 1 ouvrage piraté sur 7 l’est par l’une des deux principales équipes de pirates, qui privilégient la qualité à la quantité. [autrement dit, il s'agit d'un travail d'équipe mettant en oeuvre un workflow bien plus complexe que ceux qui copient et partagent des films ou même des séries auxquelles ont été ajoutés des sous-titres...]

La taille moyenne d’un livre piraté est de 29,7 Mo. Ce poids assez élevé traduit l’importance du nombre d’ouvrages illustrés, notamment scolaires et pratiques, en téléchargement illégal.

Le réseau peer to peer eDonkey ainsi que le direct download sont les circuits de diffusion les plus utilisés pour les livrels. Mais, contrairement à la musique, à la vidéo et aux logiciels, la faible quantité de fichiers disponibles et d’utilisateurs pour les partager rend leur accès relativement difficile.

Gilles Deleuze, Bernard Werber et Amélie Nothomb sont les auteurs ayant le plus de titres disponibles en téléchargement illégal. [Cherchez l'intru ! Hypothèse : la complexité des écrits de cet auteur appelle une nécessaire appropriation des textes : recherches, surlignages, notes, usages de lecture non linéaire qui sont bien plus faciles à avoir à partir d'un fichier, ce qui explique que d'autres philosophes figurent dans le reste du classement : Michel Foucault ou Paul Ricoeur par exemple.]

Les livres les plus souvent indexés et partagés dans les différents réseaux illégaux sont Le Sexe pour les nuls, la série Harry Potter de J.K. Rowling, le Grand Livre de cuisine d’Alain Ducasse et la série Twilight de Stephenie Meyer. [Sexe, Magie, Cuisine, les mauvaises langues diront qu'il s'agit là du reflet des principales préoccupations de nos contemporains, rappelez vous qu'il s'agit d'un très petit volume, non représentatif ;-)]

Les trois éditeurs ayant le plus de titres piratés sont Gallimard, Dunod et Hachette. [Ce sont aussi des éditeurs qui proposent une offre légale inadapté pour l'heure, trop chère, avec DRM. Ajoutons qu'Hachette paie une société capable de détecter les copies pirates d'un titre sur des réseaux p2p, voir page 31 de la version intégrale de cette étude]

Le manque de disponibilité des ouvrages en offre légale ne semble être qu’une cause partielle du piratage : 3 livres piratés sur 4 sont disponible à la vente papier. Mais 94,9 % des livres piratés ne disposent pas d’une offre numérique légale.

Le piratage concerne les parutions contemporaines : 2 ouvrages piratés sur 3 ont été publiés il y a moins de 10 ans, mais pas les nouveautés en rayon : seul 1 ouvrage piraté sur 4 a été publié il y a moins de 4 ans. [hypothèse : voilà un indicateur du fait que les usages sont différents sur le papier que sur écran, en tout cas qui laisse entrevoir d'intéressantes possibilités de médiation autour d'une longue traîne d'ouvrages récents disponibles en version numérique]

Les catégories « essais », « romans » et « livres pratiques » représentent chacune un peu plus de 25 % des livres piratés. Seuls 8 % des livres du top 50 des ventes papier en librairie sont disponibles en téléchargement illégal.

Concernant les thèmes, on constate une très forte présence des STM*, de la philosophie, de la cuisine, de la littérature de science-fiction et fantastique et de l’informatique.

Ce qui ne figure pas dans la synthèse en deux pages de l’étude mais que vous trouverez dans la version intégrale c’est un véritable appel à l’innovation en huit points précis, à mettre en rapport, du côté légal de la Force, avec les 10 commandements de Couperin pour le livre numérique.

Autrement dit, que veulent les internautes ? Là encore, on est proches de ce qui se passe pour la musique : l’accessibilité des fichiers est une base, mais un modèle économique n’existe que par une valeur ajoutée à développer.

Kevin Kelly, consultant spécialisé en nouvelles technologies et ancien rédacteur en chef de Wired Magazine, la gratuité des contenus culturels numériques ne fait pas tout. Il y a selon lui 8 autres facteurs dont les internautes tiennent compte et qui peuvent jouer en la faveur des offres légales : l’immédiateté, la personnalisation, l’interprétation, l’authenticité, l’accessibilité, l’incarnation, le mécénat, la trouvabilité. Ces 8 caractéristiques, contrairement à un simple fichier, ne peuvent pas être copiées. Comment ces caractéristiques s’appliquent‐elles au téléchargement de livrels ?


‐ L’immédiateté (immediacy) : télécharger un ouvrage illégal est encore une pratique réservée à des internautes avertis. Et, même si la maturité des usages va atténuer cette difficulté, il n’en restera pas moins que l’internaute est prêt à payer pour la facilité et la rapidité d’utilisation des sites légaux : le temps de recherche d’un fichier pirate est aussi un coût non négligeable.

‐ La personnalisation (personnalization) : l’exemple de la musique montre qu’un consommateur télécharge peut‐être gratuitement un morceau de musique, mais sera prêt à payer cher pour obtenir ce même morceau s’il est de très bonne qualité. C’est aujourd’hui déjà le cas pour certains types de musique comme la musique classique, pour laquelle la différence de qualité liée à la compression des mp3 est évidente : le véritable amateur ne peut se contenter d’un fichier mal compressé et se tournera plus facilement vers l’offre légale. Dans le cas du livre, il peut s’agir de proposer une offre personnalisée en fonction des goûts du lecteur (par exemple dans le cadre de réseaux sociaux sur le web).

L’interprétation (interpretation) : c’est une logique qui provient du monde informatique où l’on dit souvent en plaisantant que le logiciel est gratuit mais que son mode d’emploi coûte 10 000 dollars. Il est possible d’imaginer une logique similaire dans le monde du livre technique ou pratique par exemple, où ce qui sera valorisé ne sera pas le livre lui‐même mais ses applications : par exemple des cours de jardinage en ligne donnés par l’auteur d’un livre sur la botanique, etc.

‐ L’authenticité (authenticity) : le lecteur a besoin d’être sûr que le livre qu’il est en train de consulter est bien l’ouvrage authentique tel qu’il a été créé par son auteur. Qu’il n’y a pas d’erreurs typographiques ou orthographiques liées à une mauvaise saisie lors du scannage du livre, ou que des morceaux entiers n’ont pas été supprimés lors de la numérisation, ce qui arrive parfois. Et le risque de déformation ou de manipulation est véritable : autant le risque était compliqué et coûteux en vidéo, presque inutile en musique, autant pour le livre c’est extrêmement facile. Imaginons une secte modifier un texte religieux ou un même un roman
pour y glisser ses messages. Idem pour les traductions non autorisées : on pense ici à celle d’Harry Potter, truffée d’erreurs et d’approximations.

‐ L’accessibilité (accessibility) : avec la multitude des fichiers et des terminaux à notre disposition, leur accessibilité devient de plus en plus complexe. Il est indispensable qu’il y ait de nouveaux services et outils. Ce qui va être valorisé finalement n’est pas tant la gratuité des fichiers que la possibilité de les stocker, de les sauvegarder, de les organiser de façon optimale, et tout cela a une valeur marchande.‐ L’incarnation (embodiment) : avoir un produit virtuel gratuit, c’est bien, mais sa version « réelle » sera toujours mieux valorisée par le consommateur. Kevin Kelly donne l’exemple du fan qui va à un concert des Rolling Stones plutôt que de télécharger un de leurs mp3. Dans le secteur du livre, cela peut passer par une multitude d’actions qui ne peuvent avoir lieu que sur le territoire local, et qui sont extrêmement valorisées par le lecteur : « the book is free, the bodily talk is expensive » (lire un livre est gratuit mais écouter quelqu’un parler vaut cher).

‐ Le mécénat (patronage) : d’après Kevin Kelly, les lecteurs ont souvent envie de soutenir les créateurs. On peut imaginer mettre à disposition gratuitement un livre numérique avec la possibilité de donner en ligne la somme que l’on veut. Bien sûr le lecteur veut être certain que l’argent ira bien à l’auteur. Ce n’est pas un modèle économique suffisant en tant que tel, mais une alternative ou un complément.

- La trouvabilité (findability) : dans un environnement où des milliers (et bientôt des millions) de livres sont disponibles gratuitement, le lecteur veut qu’on lui propose des choix, que l’on opère des sélections pour lui. Le rôle des prescripteurs reste essentiel, qu’on les appelle des éditeurs, des agrégateurs, des diffuseurs ou des distributeurs.

L’ensemble de ces caractéristiques tend à faire valoir le fait que l’on passe d’une industrie de produits culturels (les livres) à une industrie de services culturels (les services liés aux livres).

En tant que bibliothécaire je me sens véritablement interpellé par une telle étude, alors même que vient de paraitre l’enquête décennale sur les “pratiques culturelles des français” montrant une appétence importante des moins de 35 ans pour l’écran et l’audiovisuel en général. Je partage l’interrogation d’Hubert qui questionne les impacts du numérique en terme de démocratisation. Car, au fond, l’enjeu est bien celui-là. Ces dernières décennies on été le théâtre du transfert opportun des enjeux d’une démocratisation sociologique portées par des équipements culturels vers une logique d’accessibilité moins ambitieuse en termes politiques. L’objectif politique n’est plus, par exemple, de favoriser l’égalité des chances, mais d’élargir les horaires d’ouverture des bibliothèques (donc de faire passer un moyen pour une fin, sachant qu’il est évident qu’il faut ouvrir plus).

Cette situation va-t-elle se reproduire sur le web ? Autrement dit, sera-t-on capables de mettre en œuvre des politiques publiques d’accès aux savoirs qui dépassent l’écran de fumée de l’accessibilité des contenus numériques pour agir sur leur trouvabilité et jouer sur des sérendipités capables de contribuer à leurs appropriations à des fins culturelles, pédagogiques, démocratiques ?

Laisser un commentaire

Derniers articles publiés