Comment créer un nouveau modèle de données ?
Pour créer un modèle, nous travaillons avec toutes les données dont nous disposons. Étant liquide, l’échantillon de vin est très homogène. Les composants que nous voulons mesurer seront par conséquent répartis uniformément dans tout l'échantillon.
En travaillant avec des milliers d’échantillons, nous disposons d’un spectre complet de données à traiter, et chaque spectre possède une valeur de référence que nous utilisons en laboratoire. La mesure d’un spectre est facile : il suffit d’appuyer sur un bouton. Les échantillons sont testés sur un instrument de référence en laboratoire qui utilise les données pour créer le modèle.
L’avantage de travailler chez FOSS, c’est que nous disposons déjà de toutes les données d’échantillons de vin dont nous avons besoin. Nous n’avons donc pas besoin d'aller les collecter. Nous pouvons utiliser les données du bout des doigts. Nous saisissons les données dans les algorithmes pour prédire l’arrivée de nouveaux échantillons de vin dans l’analyseur. Nos données sont si bien structurées et linéaires que nous n’avons pas besoin de méthodes sophistiquées pour construire nos modèles. Cela facilite notre travail.
De combien de données avez-vous besoin pour disposer d'un modèle fiable et comment pouvez-vous obtenir un modèle qui fonctionne pour différentes régions viticoles dans le monde ?
Nous passons beaucoup de temps à nous assurer que nous avons analysé ce que nous considérons comme les principaux composants d’un échantillon de vin. Des vinificateurs font partie de notre équipe. Nous travaillons en étroite collaboration avec eux pour nous assurer que nous n'oublions rien, aussi bien pour les vins à fortes qu'à faibles teneurs en sucre et en alcool, ce qui nous fournit toutes les combinaisons nécessaires pour la validation. Après près de 25 ans de collecte de données, nous avons ce dont nous avons besoin pour couvrir le monde entier et tous les types possibles d’échantillons de vin qui peuvent entrer dans l’une de nos machines.
Pouvez-vous expliquer le rôle de la lumière infrarouge dans le processus d’analyse ?
Lors de l’analyse d’un échantillon de vin, nous examinons les modèles vibratoires des composés organiques à l’aide de la technologie infrarouge. Nous pouvons mesurer plus de 20 composants clés dans un échantillon de vin, de sa teneur en alcool et en sucre à l’acide tartrique ; tout se résume à ce que l’infrarouge peut voir dans l’échantillon. En général, nos instruments peuvent détecter toute variable supérieure à 50 ppm. Ils sont dotés d’une source émettant de la lumière infrarouge qui traverse un composant au cœur de l’instrument appelé cuvette. Elle possède une épaisseur équivalent à un tiers de celle d'une feuille de papier. Elle doit être incroyablement fine pour que la lumière la traverse. Lorsque c'est le cas, elle est modulée et nous recevons un signal.
Les différentes caractéristiques de l’échantillon empêchent une partie de la lumière de le traverser, donc moins de lumière sort de l’autre côté. Le capteur crée un spectre infrarouge en fonction de la quantité de lumière émise. L’instrument est programmé pour reconnaître certains spectres, comme l’acide tartrique, pour n’en donner qu’un exemple. Cela apparaîtra sous la forme d’un modèle spécifique. L'instrument peut ainsi déterminer le niveau de concentration. Plus l’instrument peut utiliser de données pour créer les modèles, plus les résultats sont fiables et plus l’instrument peut gérer de variables.
Comment cette lumière infrarouge est-elle utilisée dans le processus de modélisation ?
Toutes les molécules organiques du liquide possèdent des liaisons. Lorsque la lumière traverse l’échantillon et qu'elle est à la bonne fréquence, la liaison absorbera l’énergie et ne sera pas détectée de l’autre côté.
Nos mesures constituent en réalité une transmission, car nous envoyons de la lumière à travers les échantillons. Nous recherchons ce qui ne passe pas de l’autre côté et comment la lumière est absorbée par l’échantillon de vin. Cela nous fournit l’empreinte digitale du vin qui contient toutes les molécules présentes à l’intérieur, dont beaucoup se superposent. Par exemple, si nous testons l’acide malique, nous pouvons construire un modèle qui prédit sa teneur puis appliquer ce modèle au spectre afin d'obtenir une valeur. Il s'agit d'un processus relativement simple.
Dans quelle mesure ce concept de modélisation des données est-il unique ?
Nous ne sommes plus uniques dans l’utilisation de l’idée de modélisation. Notre valeur réside dans le fait que nous avons été les premiers à utiliser ce procédé et que nous disposons désormais de données collectées au cours des 25 dernières années. Les données couvrent tous les vins du monde issus de différentes saisons et différents millésimes, chose jamais faite auparavant à une telle échelle, ce qui nous rend uniques.
Les analyseurs sont-ils mis à jour à partir d’un nuage de données ou les clients doivent-ils acheter un nouvel instrument s’ils veulent les dernières mises à jour ?
Les instruments sont constamment mis à jour à distance par FOSS via un nuage de données comme une mise à jour logicielle pendant que votre téléphone est en charge, donc vous n'avez à vous en préoccuper. Nos analyseurs FOSS sont assez similaires par nature. Par conséquent, si vous possédez deux analyseurs différents, vous pouvez les avoir en réseau et appliquer les ajustements à l’ensemble de votre équipement via le cloud.
Quels sont les principaux éléments à prendre en compte concernant la modélisation des données ?
Il est important de savoir qu’un modèle de données n’est jamais une chose fixe. Vous pouvez toujours le mettre à jour et le modifier. La valeur réside dans les données qui entrent dans le modèle, et non dans le modèle lui-même.
Plus vous entrez de données dans ces modèles, meilleur et plus fiable sera le résultat que vous en tirerez. Les gens oublient souvent cela et regardent simplement le graphique de référence et de prédictions. Certains analyseurs de vin moins sophistiqués peuvent sembler bons au départ, mais comme ils ne fonctionnent pas avec le même niveau de données de base, en cas de changement de saison ou de conditions que la machine ne reconnaît pas, le modèle ne sera plus en mesure de traiter l’échantillon. Vous ne pourrez donc pas réaliser l'analyse.