Technologia

Jak czyścić dane magazynowe w 4 krokach

Autor Anna Nowak, Data Scientist·18 grudnia 2024·8 min czytania

Większość problemów z brakiem towaru nie wynika ze złej pracy magazynierów, ale z bałaganu w tabelach Excel lub systemie ERP. Jeśli Twoje dane są błędne, to nawet najdroższy program do prognozowania wyliczy bzdury. Pokażę Ci, jak w cztery proste niedziele przygotować bazę danych tak, aby matematyka wreszcie zaczęła się zgadzać.

Krok 1: Polowanie na duplikaty i błędne nazwy

Większość magazynów w regionie Śląska, z którymi współpracowaliśmy w 2023 roku, borykała się z tym samym problemem: bałaganem w nazewnictwie. Podczas audytu w jednej z firm logistycznych w Katowicach znaleźliśmy 37 różnych sposobów zapisu tej samej palety Euro. Dla komputera to 37 różnych produktów, co sprawiało, że algorytmy zamawiały towar, który w rzeczywistości leżał na półce obok, tylko pod innym kodem. Bez lania wody: jeśli nie połączysz tych rekordów, Twoje analizy zawsze będą pokazywać, że brakuje Ci towaru, mimo że magazyn pęka w szwach.

Proces ten wymaga eksportu całej bazy towarowej do pliku CSV i posortowania jej według kodów EAN oraz nazw producentów. Warto skupić się na grupie towarów A, czyli tych 156 najdroższych pozycjach, które generują 79.1% Twojego obrotu. Poprawa błędów w tej grupie zajmuje zazwyczaj około 4-7 dni roboczych, ale przynosi natychmiastowe oszczędności w gotówce. W październiku 2024 roku nasz zespół pomógł klientowi odzyskać 3,800 zł zamrożonych w niepotrzebnych zapasach tylko dzięki usunięciu 12 zdublowanych indeksów w jedną środę.

Częstym błędem jest też zostawianie w systemie starych kodów towarów, które nie są już produkowane od 5 lat. Takie 'duchy' w bazie spowalniają działanie systemów ERP i mylą nowych pracowników. W Roskar Institute zalecamy archiwizację wszystkiego, co nie miało żadnego ruchu przez ostatnie 18 miesięcy. To upraszcza tabelę i sprawia, że modele matematyczne pracują na świeżych, istotnych danych rynkowych, co bezpośrednio przekłada się na trafność prognoz zamówień na kolejny miesiąc.

Jeśli masz 47 sztuk na stanie, ale system myśli, że to trzy osobne grupy, to nigdy nie zamówisz towaru na czas.

Krok 1: Polowanie na duplikaty i błędne nazwy

Krok 2: Naprawa dat i czasów realizacji

Magazyn musi zarabiać, a zarabia wtedy, gdy towar rotuje. Aby to wyliczyć, potrzebujemy dokładnych dat. Wiele systemów ERP posiada błędy w polach 'data dostawy' lub 'lead time'. Przykładowo, jeśli system odnotował, że dostawa z Chin trwała 2 dni, bo ktoś błędnie kliknął potwierdzenie odbioru przed faktycznym przyjazdem kontenera, to średnia z prognozy zostanie zniszczona. Realny czas dostawy to kluczowa zmienna w naszych modelach. Bez poprawienia tych rekordów, algorytm wyliczy zbyt późny termin zamówienia.

Przeanalizowaliśmy historię dostaw dla 83 projektów zrealizowanych w ostatnim kwartale. Wynik był jasny: ponad 23% dat w dokumentacji magazynowej było wpisanych z błędem ludzkim. Najczęściej wynika to z pośpiechu przy przyjmowaniu towaru na rampie. Rozwiązaniem jest audyt wsteczny ostatnich 124 dostaw. Porównaj daty z faktur papierowych z tym, co widnieje w bazie danych. Jeśli różnica wynosi więcej niż 48 godzin, musisz to skorygować ręcznie, aby Twoje prognozy zapasów bezpieczeństwa były oparte na faktach, a nie na błędach.

Pamiętaj też o wykluczeniu anomalii czasowych, takich jak przestoje świąteczne czy awarie u dostawcy w lutym 2024 roku. Takie jednorazowe zdarzenia nie powinny wpływać na stały model zamówień. Jeśli zostawisz te 'piki' czasowe w bazie, system będzie sugerował utrzymywanie zbyt wysokich zapasów, co niepotrzebnie mrozi pieniądze firmy. Liczymy konkretnie: każda doba niepotrzebnego zapasu na magazynie to koszt rzędu kilkuset złotych miesięcznie dla średniej wielkości składu w Katowicach.

Krok 3: Usuwanie ujemnych stanów magazynowych

Matematyka nie kłamie, ale systemy potrafią kłamać, pokazując stany ujemne. Widok '-12 sztuk' na stanie to sygnał, że procesy w firmie są dziurawe. Najczęściej dzieje się tak, gdy sprzedaż jest księgowana szybciej niż przyjęcie towaru na magazyn. Dla analityka danych to koszmar, bo nie da się wyliczyć popytu z wartości ujemnej. W Roskar Institute pierwszym krokiem każdej analizy jest wyzerowanie tych błędów i znalezienie ich przyczyny w obiegu dokumentów, co zazwyczaj zajmuje nam około 6-9 godzin pracy z działem logistyki.

W lipcu 2024 roku spotkaliśmy się z przypadkiem, gdzie firma miała ujemne stany na 14% swojego asortymentu. Wynikało to z faktu, że magazynierzy wydawali towar 'na słowo', a faktury były wystawiane z trzydniowym opóźnieniem. Takie dane są bezwartościowe dla jakiegokolwiek modelu AI. Dopiero po uporządkowaniu tej procedury i wprowadzeniu skanowania kodów w czasie rzeczywistym, baza danych stała się wiarygodna. Czyste dane to nie tylko porządek w komputerze, to przede wszystkim porządek w fizycznym magazynie i na rampie.

Zlikwidowanie ujemnych stanów pozwala na precyzyjne wyliczenie punktu ponownego zamówienia (Reorder Point). Jeśli system widzi zero zamiast minusa, wie dokładnie, w którym momencie wysłać sygnał do kupca. Dzięki temu nasi klienci unikają sytuacji 'pustej półki', co w przypadku małych sklepów internetowych potrafi podnieść sprzedaż o 9% w skali kwartału. To prosty rachunek: masz towar, to sprzedajesz. Nie masz towaru, bo system go źle policzył – tracisz klienta na rzecz konkurencji.

Ujemny stan na magazynie to fizyczny absurd, który niszczy każdą prognozę sprzedaży.

Krok 3: Usuwanie ujemnych stanów magazynowych

Krok 4: Standaryzacja jednostek miary

To brzmi banalnie, ale jest jednym z najtrudniejszych etapów. W tej samej bazie danych można znaleźć śruby liczone w sztukach, wagę podaną w gramach zamiast kilogramach i olej liczony raz w litrach, a raz w bańkach po 5 litrów. Aby algorytm mógł wyliczyć średnie zużycie, wszystkie dane muszą mieć wspólny mianownik. W Roskar Institute stosujemy prostą zasadę: jeden indeks to jedna, niezmienna jednostka miary. Jeśli zmieniasz sposób pakowania, stwórz nowy indeks, zamiast mieszać dane w starym.

Podczas audytu danych dla warsztatu samochodowego w Gliwicach w Q2 2024 odkryliśmy, że błędy w jednostkach zawyżały wartość magazynu o ponad 12,000 zł. System myślał, że firma ma 500 litrów płynu, podczas gdy było to 500 opakowań po 100 ml. Takie pomyłki są kosztowne. Czyszczenie danych w tym kroku polega na przejrzeniu kartotek i upewnieniu się, że przeliczniki w systemie ERP są zgodne ze stanem faktycznym. Sprawdziliśmy 47 losowych produktów i w 11 przypadkach jednostki były błędne.

Kończąc ten proces, warto wprowadzić blokadę w systemie, która uniemożliwia wpisanie towaru bez przypisanej, zatwierdzonej jednostki. To oszczędza czas w przyszłości. My w Roskar Institute uważamy, że lepiej poświęcić 2 godziny tygodniowo na weryfikację nowych wpisów, niż raz na rok spędzać dwa tygodnie na prostowaniu błędów w całej bazie. Czysta baza to podstawa do tego, by zacząć rozmawiać o automatyzacji i prognozowaniu popytu na poważnie.