Jak się tworzy nowy model danych?
Aby stworzyć model, pracujemy ze wszystkimi danymi, do których mamy dostęp. Jako ciecz, próbka wina jest bardzo jednorodna, a zatem składniki, które chcemy oznaczyć, będą równomiernie rozłożone.
Pracując z tysiącami próbek uzyskujemy pełne spektrum danych, a każde widmo ma wartość referencyjną, którą posługujemy się w laboratorium. Pomiar widma jest łatwy - wystarczy nacisnąć przycisk. Próbki są testowane na urządzeniu referencyjnym w laboratorium, które wykorzystuje dane do stworzenia modelu.
Piękno pracy w FOSS polega na tym, że mamy już wszystkie dane próbek wina, których potrzebujemy, nie musimy więc gromadzić nowych - możemy korzystać z danych na wyciągnięcie ręki. Dane wprowadzamy do algorytmów, aby oceniać nowe próbki wina trafiające do analizatora. Nasze dane są tak dobrze ustrukturyzowane i liniowe, że nie potrzebujemy wymyślnych metod do budowania modeli - jest to dla nas bardzo łatwe.
Jaka ilość danych jest potrzebna, aby model był wiarygodny i w jaki sposób można uzyskać model, który sprawdzi się w różnych regionach winiarskich na całym świecie?
Spędzamy dużo czasu upewniając się, że uwzględniliśmy w modelu to, co uznajemy za główne składniki próbki wina. W naszym zespole mamy winiarzy, z którymi ściśle współpracujemy, aby zapewnić, że obejmujemy wszystkie podstawy, od win o wysokiej zawartości cukru i alkoholu po wina o niskiej zawartości cukru i alkoholu, dając nam wszystkie niezbędne kombinacje do walidacji. Po prawie 25 latach gromadzenia danych mamy to, czego potrzebujemy, aby uwzględnić produkcję na całym świecie i każdy możliwy rodzaj próbki wina, która może trafić do jednego z naszych urządzeń.
Czy może Pan wyjaśnić rolę światła podczerwonego w procesie analizy?
Podczas analizy próbki wina przyglądamy się schematom wibracji związków organicznych za pomocą technologii podczerwieni. Możemy zmierzyć ponad 20 kluczowych składników w próbce wina, od poziomu alkoholu i cukru po kwas winowy - wszystko sprowadza się do tego, co podczerwień może zobaczyć w próbce. Ogólnie rzecz biorąc, nasze urządzenia mogą wykryć każdą zmienną o wielkości powyżej 50 ppm. Są wyposażone w źródło światła podczerwonego, które przechodzi przez element w środku urządzenia zwany kuwetą. Ma on grubość jednej trzeciej kartki papieru - musi być niewiarygodnie cienka, aby światło mogło przez nią przejść. Kiedy to się dzieje, światło jest modulowane i otrzymujemy sygnał.
Różne właściwości próbki zatrzymują część przechodzącego przez nią światła, więc mniej światła wychodzi po drugiej stronie. Czujnik tworzy widmo podczerwieni w oparciu o ilość światła, które wyszło. Urządzenie jest zaprogramowane do rozpoznawania określonych widm, takich jak np. kwas winowy. Pojawią się one jako określony wzór i na tej podstawie można obliczyć stężenie. Im więcej danych urządzenie może wykorzystać do tworzenia modeli, tym bardziej wiarygodne są wyniki i tym więcej zmiennych urządzenie może obsłużyć.
W jaki sposób światło podczerwone jest wykorzystywane w procesie modelowania?
Wszystkie cząsteczki organiczne w cieczy mają wiązania. Kiedy światło przechodzi przez próbkę i jeśli światło ma odpowiednią częstotliwość, wiązanie pochłonie energię i nie zostanie wykryte po drugiej stronie.
Nasze pomiary to tzw. metoda transmisyjna, ponieważ przepuszczamy światło przez próbki. Szukamy tego, co nie jest widoczne po drugiej stronie i przyglądamy się temu, jak światło jest pochłaniane przez próbkę wina Daje nam to odcisk palca wina, który zawiera wszystkie obecne w nim cząsteczki, z których wiele nakłada się na siebie Jeśli na przykład oznaczamy kwas jabłkowy, możemy zbudować model, który przewiduje kwas jabłkowy, zastosować ten model do widma, aby uzyskać wartość kwasu jabłkowego. Jest to relatywnie łatwy proces.
W jakim stopniu ta koncepcja modelowania danych jest wyjątkowa?
Nie jesteśmy już wyjątkowi w korzystaniu z pomysłu modelowania - nasza wartość polega na tym, że byliśmy pierwsi i mamy teraz dane, które zebraliśmy w ciągu ostatnich 25 lat. Dane obejmują wszystkie różne wina na świecie z różnych sezonów wegetacyjnych i roczników, co nie zostało wcześniej zrobione na taką skalę, co czyni nas wyjątkowymi.
Czy analizatory są aktualizowane z chmury danych, czy też klienci musieliby kupić nowe urządzenie, jeśli chcą uzyskać najnowsze aktualizacje?
Urządzenia są zdalnie aktualizowane przez FOSS za pośrednictwem chmury, podobnie jak ma to miejsce w przypadku aktualizacji oprogramowania podczas ładowania telefonu, a więc użytkownicy nie muszą w ogóle o tym myśleć. Nasze analizatory są dość podobne do siebie, więc jeśli masz dwa różne analizatory, możesz połączyć je w sieć i wprowadzić opowiednie korekty do całej floty za pośrednictwem chmury.
Jakie są najistotniejsze rzeczy, które należy wziąć pod uwagę przy modelowaniu danych?
Ważne jest, aby wiedzieć, że model danych nigdy nie jest czymś stałym; zawsze można go aktualizować i zmieniać. Wartość tkwi w danych, które trafiają do modelu, a nie w samym modelu.
Im więcej danych umieścisz w tych modelach, tym lepsze i bardziej wiarygodne wyniki uzyskasz. Ludzie często o tym zapominają i po prostu patrzą na wykres referencyjny i prognozy. Niektóre mniej wyrafinowane analizatory wina mogą wydawać się dobre na początku, ale ponieważ nie pracują z tym samym poziomem podstawowych danych, jeśli nastąpi zmiana pory roku lub wystąpią warunki, których maszyna nie rozpoznaje, model nie będzie w stanie poradzić sobie z próbką i zostaniemy wprowadzeni w błąd.