Modelowanie danych

Zacznijmy od podstaw - czym jest modelowanie danych i jak działa?

Nasze analizatory wina generują widmo zmiennych danych wymiarowych, z którymi możemy pracować. Aby dokonać prognozy pomiarowej, musimy przekształcić to widmo w wartość użyteczną dla użytkownika końcowego - którym w tym przypadku jest producent wina. Odbywa się to poprzez przekształcenie widma wyjściowego w tak zwane widmo absorbancji. Stanowi ono źródło surowych danych dla dalszych prac na modelu.

Musimy zebrać dużą ilość danych, aby dokładnie opisać wszystkie rodzaje zmian, których możemy się spodziewać w pojedynczej próbce wina. Analizatory te nie mogą być używane na przykład do badania mleka. Są całkowicie przystosowane do testów wina i wykonują swoją pracę w oparciu o konkretne rozwiązania matematyczne.

Jedną z wyjątkowych cech naszych innowacyjnych analizatorów do wina jest to, że są one oparte na całej skarbnicy danych, które zebraliśmy przez lata w ramach programu rozwoju WineScan™. Pracujemy w tym sektorze rynku od 1999 roku, nieustannie gromadząc dane, a więc mamy około 25 lat doświadczenia, z którego możemy czerpać. Doszliśmy do etapu, w którym mamy punkty odniesienia dla wszystkich win na świecie.

Jak się tworzy nowy model danych?

Aby stworzyć model, pracujemy ze wszystkimi danymi, do których mamy dostęp. Jako ciecz, próbka wina jest bardzo jednorodna, a zatem składniki, które chcemy oznaczyć, będą równomiernie rozłożone.

Pracując z tysiącami próbek uzyskujemy pełne spektrum danych, a każde widmo ma wartość referencyjną, którą posługujemy się w laboratorium. Pomiar widma jest łatwy - wystarczy nacisnąć przycisk. Próbki są testowane na urządzeniu referencyjnym w laboratorium, które wykorzystuje dane do stworzenia modelu.

Piękno pracy w FOSS polega na tym, że mamy już wszystkie dane próbek wina, których potrzebujemy, nie musimy więc gromadzić nowych - możemy korzystać z danych na wyciągnięcie ręki. Dane wprowadzamy do algorytmów, aby oceniać nowe próbki wina trafiające do analizatora. Nasze dane są tak dobrze ustrukturyzowane i liniowe, że nie potrzebujemy wymyślnych metod do budowania modeli - jest to dla nas bardzo łatwe.

Jaka ilość danych jest potrzebna, aby model był wiarygodny i w jaki sposób można uzyskać model, który sprawdzi się w różnych regionach winiarskich na całym świecie?

Spędzamy dużo czasu upewniając się, że uwzględniliśmy w modelu to, co uznajemy za główne składniki próbki wina. W naszym zespole mamy winiarzy, z którymi ściśle współpracujemy, aby zapewnić, że obejmujemy wszystkie podstawy, od win o wysokiej zawartości cukru i alkoholu po wina o niskiej zawartości cukru i alkoholu, dając nam wszystkie niezbędne kombinacje do walidacji. Po prawie 25 latach gromadzenia danych mamy to, czego potrzebujemy, aby uwzględnić produkcję na całym świecie i każdy możliwy rodzaj próbki wina, która może trafić do jednego z naszych urządzeń.

Czy może Pan wyjaśnić rolę światła podczerwonego w procesie analizy?

Podczas analizy próbki wina przyglądamy się schematom wibracji związków organicznych za pomocą technologii podczerwieni. Możemy zmierzyć ponad 20 kluczowych składników w próbce wina, od poziomu alkoholu i cukru po kwas winowy - wszystko sprowadza się do tego, co podczerwień może zobaczyć w próbce. Ogólnie rzecz biorąc, nasze urządzenia mogą wykryć każdą zmienną o wielkości powyżej 50 ppm. Są wyposażone w źródło światła podczerwonego, które przechodzi przez element w środku urządzenia zwany kuwetą. Ma on grubość jednej trzeciej kartki papieru - musi być niewiarygodnie cienka, aby światło mogło przez nią przejść. Kiedy to się dzieje, światło jest modulowane i otrzymujemy sygnał.

Różne właściwości próbki zatrzymują część przechodzącego przez nią światła, więc mniej światła wychodzi po drugiej stronie. Czujnik tworzy widmo podczerwieni w oparciu o ilość światła, które wyszło. Urządzenie jest zaprogramowane do rozpoznawania określonych widm, takich jak np. kwas winowy. Pojawią się one jako określony wzór i na tej podstawie można obliczyć stężenie. Im więcej danych urządzenie może wykorzystać do tworzenia modeli, tym bardziej wiarygodne są wyniki i tym więcej zmiennych urządzenie może obsłużyć.

W jaki sposób światło podczerwone jest wykorzystywane w procesie modelowania?

Wszystkie cząsteczki organiczne w cieczy mają wiązania. Kiedy światło przechodzi przez próbkę i jeśli światło ma odpowiednią częstotliwość, wiązanie pochłonie energię i nie zostanie wykryte po drugiej stronie.

Nasze pomiary to tzw. metoda transmisyjna, ponieważ przepuszczamy światło przez próbki. Szukamy tego, co nie jest widoczne po drugiej stronie i przyglądamy się temu, jak światło jest pochłaniane przez próbkę wina Daje nam to odcisk palca wina, który zawiera wszystkie obecne w nim cząsteczki, z których wiele nakłada się na siebie Jeśli na przykład oznaczamy kwas jabłkowy, możemy zbudować model, który przewiduje kwas jabłkowy, zastosować ten model do widma, aby uzyskać wartość kwasu jabłkowego. Jest to relatywnie łatwy proces.

W jakim stopniu ta koncepcja modelowania danych jest wyjątkowa?

Nie jesteśmy już wyjątkowi w korzystaniu z pomysłu modelowania - nasza wartość polega na tym, że byliśmy pierwsi i mamy teraz dane, które zebraliśmy w ciągu ostatnich 25 lat. Dane obejmują wszystkie różne wina na świecie z różnych sezonów wegetacyjnych i roczników, co nie zostało wcześniej zrobione na taką skalę, co czyni nas wyjątkowymi.

Czy analizatory są aktualizowane z chmury danych, czy też klienci musieliby kupić nowe urządzenie, jeśli chcą uzyskać najnowsze aktualizacje?

Urządzenia są zdalnie aktualizowane przez FOSS za pośrednictwem chmury, podobnie jak ma to miejsce w przypadku aktualizacji oprogramowania podczas ładowania telefonu, a więc użytkownicy nie muszą w ogóle o tym myśleć. Nasze analizatory są dość podobne do siebie, więc jeśli masz dwa różne analizatory, możesz połączyć je w sieć i wprowadzić opowiednie korekty do całej floty za pośrednictwem chmury.

Jakie są najistotniejsze rzeczy, które należy wziąć pod uwagę przy modelowaniu danych?

Ważne jest, aby wiedzieć, że model danych nigdy nie jest czymś stałym; zawsze można go aktualizować i zmieniać. Wartość tkwi w danych, które trafiają do modelu, a nie w samym modelu.

Im więcej danych umieścisz w tych modelach, tym lepsze i bardziej wiarygodne wyniki uzyskasz. Ludzie często o tym zapominają i po prostu patrzą na wykres referencyjny i prognozy. Niektóre mniej wyrafinowane analizatory wina mogą wydawać się dobre na początku, ale ponieważ nie pracują z tym samym poziomem podstawowych danych, jeśli nastąpi zmiana pory roku lub wystąpią warunki, których maszyna nie rozpoznaje, model nie będzie w stanie poradzić sobie z próbką i zostaniemy wprowadzeni w błąd.

Modelowanie globalnej jakości wina

Starszy analityk danych FOSS, Kasper Winther Jørgensen, zabiera nas na wycieczkę po maszynowni modelowania danych, gdzie instrumenty analityczne są zaprogramowane do rozpoznawania jakości wina na całym świecie.

Porozmawiajmy o potencjale jaki dają nieograniczone możliwości analityczne na przestrzeni całego procesu produkcji wina

Modelowanie globalnej jakości wina

Starszy analityk danych FOSS, Kasper Winther Jørgensen, zabiera nas na wycieczkę po maszynowni modelowania danych, gdzie instrumenty analityczne są zaprogramowane do rozpoznawania jakości wina na całym świecie.

Porozmawiajmy o potencjale jaki dają nieograniczone możliwości analityczne na przestrzeni całego procesu produkcji wina

Porozmawiajmy o potencjale jaki dają nieograniczone możliwości analityczne na przestrzeni całego procesu produkcji wina

Wystąpił błąd!

Dziękujemy za zainteresowanie

Skontaktujemy się najszybciej jak będzie to możliwe.

Dowiedz się więcej

Więcej danych, mniej pracy i więcej czasu na produkcję wina - trzy powody, dla których WineScan™ 3 pojawia się we właściwym momencie.

Jak działa spektroskopia wibracyjna

Drobne detale które definiują wino wysokiej jakości

Zapisz się, żeby otrzymywać informacje i wiadomości od FOSS

Wystąpił błąd!

Dziękujemy za chęć bycia na bieżąco. Nie możemy się doczekać, żeby przesłać Ci najnowszą porcję wiedzy.