Like

W poprzednim wpisie pokazywałem możliwości filtrowania dużej tabeli według różnych kryteriów. Tym razem skupiam się na przygotowaniu danych potrzebnych do budowania wykresów. Za materiał posłuży mi baza ofert samochodów używanych z Otomoto udostępniona przez Aleksandra Glotova.

Do tego warto ściągnąć sobie kopię mojego pliku roboczego w którym wszystko śmiga.

Tym razem nie opisuję krok po kroku powstawania wszystkich formuł, a raczej pokazuję przykłady, które pomagają zebrać dane do stworzenia wykresów. Jeśli zupełnie nie znacie formuły Query, to jest o niej osobny obszerny wpis.

Przygotowany plik pozwala wyświetlić szereg wykresów dotyczących auta wybranego przez użytkownika za pomocą rozwijanej listy. Do wyboru jest ponad 320 najpopularniejszych modeli z polskiego rynku. Ilustracje we wpisie dotyczą VW Golfa, którego wszyscy znają, ale wystarczy chwila (niestety dłuższa, bo przeliczenie i przerysowanie wykresów zajmuje około 30 sekund), i na ekranie mogą być dane dotyczące Merca S-Klasy.

Zakładka Dashboard pozwala wybierać modele aut z rozwijanej listy. Dane automatycznie się przeliczą.

Jeśli zainteresuje Cię sposób powstania wykresu, możesz podejrzeć dane użyte do niego i formułę zbierającą danę. Każdy wykres jest tak przedstawiony w zakładce “Opisy powstawania wykresów”, natomiast surowe dane (cała baza), kryją się w zakładce “dane”.

Na pierwszym wykresie dobrze widać, jak mała jest dostępność nowych aut i jak szybko spada ich cena. Nowy golf kosztuje średnio 134 tys. złotych, natomiast auto z 2018 roku już tylko 72 tysiące. Przy czym widać, że chętnie oferowane są golfy 3-4 letnie jak i 12 letnie w średniej cenie 22 800 zł.

Wykres z dwoma osiami pionowymi i osobnymi skalami dla liczby ofert i średniej ceny

Prosty wykres kołowy ilustruje rozkład rodzajów paliwa używanych przez oferowane auta:

Wykres wykorzystuje wszystkie oferty ze wszystkich roczników. Udziały % są wyliczane automatycznie.

Rodzaje paliwa w zależności od rocznika to przykład wykresu skumulowanego. Pokazuje jak rok po roku zmieniają się proporcje rodzajów paliwa w autach. LPG jest oferowane głównie w golfach starszych niż dekada, hybrydy i elektryki ciągle stanowią ułamek ofert, a diesle zupełnie ostatnio znikły.

Kolejna ciekawostka to średni przebieg w zależności od rocznika. Zauważcie, że w przypadku golfa, średni przebieg u aut starszych, rośnie bardzo powoli.

Jakby dawniej nimi nie jeżdżono. Auto z 2010 roku ma średnio nakręcone 193 tysiące, a auto dekadę starsze 235 tysięcy. Może to być związane z fałszowaniem liczników, a może wynikać z faktu, że handlarze nie sprowadzają aut z większymi przebiegami, bo nie da się na nie uzyskać dobrej ceny. To oczywiście tylko moje dywagacje, słabo znam się na rynku samochodów i pozostawiam interpretację osobom lepiej ogarniającym ten świat. Użyte tu zostały wykresy warstwowe.

Do kolejnego zestawienia użyłem liniowego wykresu ze skalą logarytmiczną. Pokazuje on jak układa się cena wybranego modelu na tle innych aut danego producenta. Użycie zwykłej skali liniowej sprawiło by, że lewa część oferty (najstarsze auta) byłaby nieczytelna.

Na tym zestawieniu widać, że golf jest konsekwentnie droższy od mniejszego polo, ale w wielu rocznikach ma cenę równą dużemu touranowi. W starszych rocznikach kosztuje często tyle co passat.

Przyjrzałem się również związkowi między rodzajem paliwa, a ceną auta. Diesle w niemal całym przedziale roczników golfa są najtańsze. Widać, że auta zagazowane bywają droższe, ale nie jest to regułą. Jest ich na tyle mało w zestawieniu, że pojedyncze sztuki mogą zaciemniać obraz.

Widać też, że pojawiające się w ostatnich latach hybrydy i elektryki są droższe od tradycyjnych spalinowych golfów.

Na koniec wykres, którego przygotowanie zajęło mi najwięcej czasu. Arkusze Google kuleją nieco jeśli chodzi o wykresy kropkowe i bąbelkowe. Ciężko mi było zrobić rozróżnienie kolorystyczne dla poszczególnych roczników. To chyba będzie temat na osobny wpis.

Celem tego wykresu było pokazanie jak zmienia się równocześnie cena jak i przebieg w zależności od wieku auta. I jaki jest rozrzut ofert. Żeby poprawić przejrzystość wykresu, pogrupowałem auta po 5 lat i każdej grupie przydzieliłem kolor. Wyrysowałem również linie trendu by można było zobaczyć jak średnio zmieniają się parametry.

Zapraszam do samodzielnych analiz i interpretacji. Dane zostały zebrane 21 stycznia 2022 roku. W momencie publikacji są bardzo świeże, ale nie potrwa to długo. Jednak moim celem jest przede wszystkim pokazanie sposobów obróbki danych i ich wizualizacji w ramach możliwości arkuszy google.

Przypominam: Do zabawy najlepiej ściągnij plik roboczy. Możesz go dowolnie modyfikować, bez obawy o uszkodzenie oryginału.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.