L’intelligence artificielle (IA) est le sujet high-tech trendy du moment. Croissance des capacités de calcul et explosion des données structurées ont créé les conditions du renouveau de l’IA. L’intelligence artificielle, c’est quoi au juste ? On peut la définir comme la capacité des ordinateurs à résoudre…
Lire la suite »
Big data
6 histoires sur le vin que le Big Data nous raconte
Quand les technologies les plus nouvelles rencontrent nos vins et nos terroirs, on se dit que ça va faire des bulles. Cet article s’attache à prouver qu’au contraire, la technologie peut se mettre au service d’une des industries les plus traditionnelles. Le Big Data (comprendre en…
Lire la suite »
6 histoires sur le vin que le Big Data nous raconte
Quand les technologies les plus nouvelles rencontrent nos vins et nos terroirs, on se dit que ça va faire des bulles. Cet article s'attache à prouver qu'au contraire, la technologie peut se mettre au service d'une des industries les plus traditionnelles.
Le Big Data (comprendre en français "gros volume de données"), c'est l'ensemble des informations produites par nos activités quotidiennes et laissées en traces sur internet.
Nos recherches sur Google, nos achats en ligne, notre localisation, nos lectures, notre utilisation d'objets connectés (terminal de paiement, smartphones, ...), nos activités sur les réseaux sociaux (twitter, facebook, ...) génèrent des informations qui semblent anodines lorsqu'elles sont considérées les unes indépendamment des autres, mais qui peuvent s'avérer très intéressantes quand elles sont exploitées intelligemment (et anonymement). Ces informations représentent un volume colossal et sont issues d'une telle variété de sources que les outils traditionnels d'analyse ne permettent pas de les exploiter.
C'est la que le Big Data intervient: en se posant les bonnes questions, en corrélant les bonnes informations, il devient possible de générer une information de plus grande valeur à partir d'un grand nombre d'informations anodines.
Jusque là, il n'a pas été beaucoup question de vin. Mais vous l'avez deviné: le Big Data peut se mettre au service de l'industrie du vin. Anticiper les maladies, trouver la date optimale de la taille et des vendanges, mieux comprendre les usages de consommation du vin, identifier des tendances commerciales.... chacun des acteurs du secteur peut y trouver son compte !
Cet article vous présente 6 petites histoires originales liées au vin, mises en évidence par de simples outils de Big Data :
Les box de vin par abonnement viennent concurrencer les sites de ventes en ligne
La popularité toute récente du vin aux Etats-Unis
L'influence du film Sideways dans la consommation du vin aux Etats-Unis
La popularité croissante des vins siciliens
La bulle spéculative des vins de Bourgogne
Le réchauffement climatique, s'il était encore besoin de le prouver
Les box de vin par abonnement viennent concurrencer les sites de ventes en ligne
Google Trends est un outil Google qui permet de connaître la fréquence à laquelle un mot clef à été recherché dans le moteur de recherche Google. Ces résultats permettent d'identifier et de comparer des tendances dans le temps.
Nous avons comparé sur Google Trends les termes "Vin en ligne", "Vin caviste" et "Vin abonnement", en se concentrant sur les recherches en français de Janvier 2008 à Septembre 2015.
Ce graphique met clairement en avant le fait les box de vins par abonnement qui ont fait leur apparition en 2013 viennent concurrencer les plateformes de vente de vin en ligne, bien plus qu'elles ne concurrencent les cavistes traditionnelles. En effet, la courbe bleue (vin en ligne) qui est supérieure à la courbe rouge (vin caviste) jusqu'en 2013, vient rejoindre et passe sous la courbe rouge en 2014 au fur et à mesure que la courbe jaune (vin abonnement) se développe.
La popularité toute récente du vin aux Etats-Unis
Google nGram Viewer est un autre outil de Google qui permet de mesurer la fréquence d'un ou plusieurs mots dans une base de donnée de livres scannés. Il permet de mesurer le nombre d’occurrences d'un ou plusieurs termes dans la littérature à travers le temps, ce qui peut être interprété comme l'évolution de l'intérêt porté à ces mots clefs. Comme Google Trends, il peut être utiliser pour identifier des tendances, à la différence près que son historique remonte bien plus loin que l'apparition d'internet. Nous avons recherché le nom de quatre cépages dans Ngram Viewer: Merlot, Pinot, Sauvignon, Chardonnay.
Nous avons filtré les résultats en fonction de la langue:
Dans la littérature française:
[iframe name="ngram_chart" src="https://books.google.com/ngrams/interactive_chart?content=chardonnay%2Csauvignon%2Cpinot%2Cmerlot&year_start=1800&year_end=2000&corpus=19&smoothing=3&share=&direct_url=t1%3B%2Cchardonnay%3B%2Cc0%3B.t1%3B%2Csauvignon%3B%2Cc0%3B.t1%3B%2Cpinot%3B%2Cc0%3B.t1%3B%2Cmerlot%3B%2Cc0" width=100% height=350 marginwidth=0 marginheight=0 hspace=0 vspace=0 frameborder=0 scrolling=no]
Dans la littérature américaine:
[iframe name="ngram_chart" src="https://books.google.com/ngrams/interactive_chart?content=chardonnay%2Csauvignon%2Cpinot%2Cmerlot&year_start=1800&year_end=2000&corpus=17&smoothing=3&share=&direct_url=t1%3B%2Cchardonnay%3B%2Cc0%3B.t1%3B%2Csauvignon%3B%2Cc0%3B.t1%3B%2Cpinot%3B%2Cc0%3B.t1%3B%2Cmerlot%3B%2Cc0" width=100% height=350 marginwidth=0 marginheight=0 hspace=0 vspace=0 frameborder=0 scrolling=no]
L'observation de ses courbes nous apprend deux choses:
1 - En France, la littérature a commencé à s'intéresser à ces cépages, et donc au vin en général, au milieu du XIXème siècle, alors que dans la littérature américaine, ces courbes ne décolent que dans les années 1970, soit plus de 100 ans plus tard ! Cette information confirme le développement récent de l'intérêt que les américains portent au vin, là où le vin fait partie intégrante de la culture européenne depuis des siècles.
2 - Il est par ailleurs intéressant de noter deux tendances claires et divergentes entre la France et l'Amérique: depuis une vingtaine d'année, on note un intérêt croissant pour le chardonnay dans la littérature américaine, alors qu'en France une tendance similaire est observée mais pour un cépage différent: le sauvignon. C'est aujourd'hui le cépage évoqué le plus souvent dans la littérature française. Vous noterez que cette tendance pour signifier un intérêt accru aussi bien pour le "cabernet sauvignon" que pour le "sauvignon blanc". Pour les départager, recherchons "cabernet sauvignon" et "sauvignon blanc" dans Ngram viewer.
[iframe name="ngram_chart" src="https://books.google.com/ngrams/interactive_chart?content=cabernet+sauvignon%2C+sauvignon+blanc&year_start=1800&year_end=2000&corpus=19&smoothing=3&share=&direct_url=t1%3B%2Ccabernet%20sauvignon%3B%2Cc0%3B.t1%3B%2Csauvignon%20blanc%3B%2Cc0" width=100% height=350 marginwidth=0 marginheight=0 hspace=0 vspace=0 frameborder=0 scrolling=no]
La réponse est claire: il s'agit du "cabernet sauvignon".
L'influence du film Sideways dans la consommation du vin aux Etats-Unis
Sideways - film américain d'Alexander Payne sorti en 2004 - est un de ces films qui décrit la société autant qu'il l'influence. Roadtrip à travers la route des vins californienne, le film raconte la tournée initiatique de deux personnages que tout oppose à travers les caves à vin de la Nappa Valley. Dans ce film, l'un des personnages prend fait et cause pour le cépage Pinot, au détriment du Merlot.
https://www.youtube.com/embed/BL8Pvlm2tuM
Le Big Data nous aide à mesurer l'impact de ce film sur la consommation de vin aux Etats-Unis. Pour cela, nous utilisons à nouveau Google Trends, et recherchons tout simplement les termes "pinot" et "merlot" et limitons la recherche sur le territoire des Etats-Unis.
Si la courbe ne montre pas de rupture franche, il faut remarquer cette inversion de tendance: en 2004, la courbe rouge (Merlot) et supérieure à la courbe bleue (Pinot), indiquant un intérêt plus fort des américains pour le cépage Merlot. Dès 2005, cette tendance s'inverse durablement.
Confirmé par les chiffres de vente de ces vins dans les années qui ont suivi le film, cette information rend compte à quel point un simple film peut influencer nos usages de consommation.
La popularité croissante des vins siciliens
Vivino est le plus grand réseau social du vin, regroupant une communauté de 9 millions d'utilisateurs à travers le monde. L'application mobile dont nous avons parlé ici génère des millions de scan, de commentaires, de notes chaque mois. Ces informations, bien exploitées relèvent des tendances que Vivino ne manque pas de monétiser.
[caption id="attachment_1321" align="alignright" width="300"] Evolution des notes moyennes des vins siciliens sur Vivino[/caption]
En effet, comprenant la valeur de ces données, Vivino ne les rend pas public (on parlerait alors d'Open Data). L'occasion est trop belle de les vendre aux professionnels du vin qui sont prèts à payer pour les obtenir.
Cependant, Vivino partage de temps en temps des histoires intéressantes, comme celles de l'évolution de la note moyenne que les membres de la communauté ont attribué aux vins siciliens. Cette tendance illustre quantitativement le gros travail des vignerons siciliens pour améliorer la qualité de leur produit. Et ça paye !
La bulle spéculative des vins de Bourgogne
Idealwine est une plateforme en ligne d'achat et de vente de grands vins. Forte de 3 millions de cotations, Idealwine se présente comme l'argus du vin et propose un système de ventes aux enchères en ligne, en salle, et de ventes à prix fixe.
Ces activités placent idealwine en position idéale pour mesurer l'évolution du prix que les consommateurs sont prêts à payer pour s'offrir de grands vins.
[caption id="attachment_1852" align="alignright" width="300"] WInedex est un indicateur des prix du vin géré par Idealwine[/caption]
Comme Vivino, Idealwine n'ouvre pas l'ensemble des données de ces transactions au grand public, mais les utilise pour publier des indicateurs de l'évolution du prix du vin: les "Winedex".
On remarque que depuis début 2014, l'augmentation des prix des vins du Bourgogne est bien plus marquée que celle des vins de Bordeaux et des Côtes du Rhône. Si cette tendance peut s'expliquer par un effet de rareté (on rappelle que le vignoble de Bordeaux produit quatre fois plus de vin en volume que celui de Bourgogne), on peut se demander si Idealwine n'a pas détecté ici une bulle spéculative qui ne demande qu'à exploser.
Le réchauffement climatique, s'il était encore besoin de le prouver
En cette période de COP21, nous proposons de conclure ce florilège sur une information qui n'est malheureusement pas nouvelle mais que certains continuent de nier: les effets concrets du réchauffement climatique sur les cycles naturels, illustrés par l'évolution de la date de début des vendanges dans un vignoble des Côtes du Rhône:
[caption id="attachment_1851" align="aligncenter" width="300"] Illustration du réchauffement climatique et de son impact sur la viticulture: les vendanges ont lieu en moyenne 20 jours plus tôt qu'il y a 70 ans[/caption]
Les vendanges commencent aujourd'hui en moyenne 3 semaines plus tôt qu'il y a 70 ans.
Et vous, quelles informations avez-vous pu extraire de ces outils Big Data ?