Dołącz do czytelników
Brak wyników

Praca i pieniądze , Laboratorium

12 lutego 2016

Skąd wiadomo, czego nie wiadomo?

19

Posługując się metodami podobnymi do tych, na których opiera się działanie ludzkiego umysłu, sieci handlowe potrafią perfekcyjnie przewidzieć nasze zachowania. Dzięki temu wiedzą np., że w markecie piwo warto postawić obok jednorazowych pieluszek.

Niedawno zadzwoniła do mnie przedstawicielka firmy telefonii komórkowej, w której mam abonament, proponując mi dostęp do Internetu na promocyjnych warunkach. Stałem się tym samym celem tak zwanego cross-sellingu, czyli sprzedawania dodatkowej usługi komuś, kto już jest klientem danej firmy. Jak się kiedyś dowiedziałem, klienci, którym oferuje się tego typu promocje, to tak zwana ciepła baza. Zwykle nie odkładają słuchawki na początku rozmowy; z dosyć dużym prawdopodobieństwem wysłuchają oferty do końca.

Zapewne większość z was spotkała się z cross-sellingiem: proponowano wam dodatkowe ubezpieczenie, ponieważ macie kartę kredytową; atrakcyjną pożyczkę gotówkową, bo posiadacie konto w banku; zniżkę na pizzę, bo jesteście „ważnym” klientem. Czy zastanawialiście się kiedyś, dlaczego właśnie wy zostaliście wybrani? To, że macie konto w banku, telefon komórkowy czy kartę stałego klienta w sieciowej pizzerii to przecież nie jest jeszcze wystarczający powód. Liczba abonentów każdej z trzech największych sieci telefonii komórkowej przekracza 14 milionów.

Gdyby operator postanowił zadzwonić tylko do miliona klientów i gdyby udało mu się kontaktować z dwoma na minutę, to operacja taka, przy założeniu, że wykonuje ją jedna osoba i dzwoni 24 godziny na dobę, zajęłaby prawie rok... A zatem musiały istnieć jakieś powody wybrania akurat tego, a nie innego numeru telefonu. Jednym z winnych tego, że padło akurat na was, jest ang[-]likański biskup Thomas Bayes (1701–1761). W jednej ze swoich prac sformułował on twierdzenie, które pozwala na obliczenia tzw. odwróconych prawdopodobieństw.

Co to za choroba?

Wyobraźmy sobie lekarza pracującego w małej miejscowości na północy Polski. Zgłasza się do niego 80-letnia pacjentka z objawami charakterystycznymi dla tropikalnej choroby. Czy należy pacjentkę wysłać do Instytutu Medycyny Tropikalnej? Racjonalnie postępujący lekarz powinien spróbować najpierw jakoś ocenić prawdopodobieństwo tego, że pacjentka rzeczywiście ma tropikalną grypę. Zgodnie z podejściem bayesowskim jest to tak zwane prawdopodobieństwo a posteriori, czyli ocena prawdopodobieństwa tego, że jakaś hipoteza (H = tropikalna choroba) jest prawdziwa, gdy dysponuje się pewnymi danymi (D = objawy). Ocena prawdopodobieństwa a posteriori wymaga wzięcia pod uwagę dwóch rodzajów informacji. Po pierwsze lekarz powinien uwzględnić to, czy w ogóle możliwe jest, aby w regionie, w którym prowadzi praktykę, pojawiła się jakakolwiek tropikalna choroba.

W teorii nazywa się to prawdopodobieństwem a priori. Załóżmy, że lekarz intuicyjnie ocenia je na 1 procent. Po drugie lekarz powinien ocenić, na ile charakterystyczne (diagnostyczne) dla danej choroby tropikalnej są objawy, z którymi zgłasza się pacjentka. To może sprawdzić w odpowiedniej literaturze. Załóżmy, że dowiedział się, że w 90 proc. przypadków objawy, które właśnie zaobserwował, oznaczają chorobę tropikalną, a w 10 proc. to tzw. fałszywy alarm. Jeszcze jedna rzecz, którą powinien ustalić lekarz, to kryterium decyzyjne. Ponieważ lekarz jest ostrożny, więc może ustalić, że wyśle pacjentkę na odpowiednie badanie wtedy, gdy prawdopodobieństwo choroby tropikalnej przekroczy 10 proc. Przekroczy? Po podstawieniu do równania Bayesa można wyliczyć, że prawdopodobieństwo tropikalnej grypy u pacjentki wynosi 8 proc. Na razie nie ma potrzeby wysyłać jej do Instytutu Medycyny Tropikalnej. Można też spróbować samemu, intuicyjnie odpowiedzieć na to pytanie. Do tego trzeba by oszacować, w jakim stopniu należy sugerować się powszechnością tropikalnych chorób na północy Polski, a w jakim stopniu tym, że objawy są podobne do tych opisanych w tropikalnej chorobie.

Naiwny klasyfikator


Wróćmy teraz do telefonii komórkowej. Dlaczego do nas zadzwoniono? Do naszego równania zamiast „choroba tropikalna” wpiszmy tym razem zwrot „klient akceptuje dodatkową ofertę”. Prawdopodobieństwo a priori to ocena tego, na ile przeciętny klient jest skłonny dokupić coś nowego do listy swoich usług. To można oczywiście policzyć.

Przypomnijmy, że dysponujemy bazą ponad 14 milionów klientów. Na tej podstawie możemy ocenić, ilu z nich wcześniej odpowiedziało pozytywnie na podobne propozycje. Trzeba też znaleźć odpowiednie prawdopodobieństwa warunkowe. Można na przykład sprawdzić, jaki jest związek wielkości rachunku za rozmowy z faktem posiadania dodatkowej oferty. Może się na przykład okazać, że klienci, którzy płacą rachunki powyżej 100 zł, znacznie częściej posiadają również dostęp do komórkowego internetu, niż ci, którzy płacą mniej. Ale czemu ograniczać się tylko do wielkości rachunku? Możemy też obliczyć prawdopodobieństwa warunkowe, wykorzystując inne dane: czas trwania umowy, liczbę telefonów na infolinię, terminowość płacenia rachunków... W zasadzie możemy wykorzystać wszystkie dane, jakie mamy – potrzebny jest do tego jedynie dosyć wydajny komputer.

W ten sposób zbudowaliśmy naiwny klasyfikator bayesowski – algorytm obliczeniowy, który pozwala na klasyfikowanie badanych obiektów na podstawie dostępnych prawdopodobieństw a priori (jak często coś w ogóle ma miejsce) oraz prawdopodobieństw warunkowych (na ile dane, którymi dysponujemy, pozwalają przewidzieć zachowania klientów). Naiwne klasyfikatory bayesowskie są jedną z metod wykorzystywanych do obliczania wartości tak zwanego skoringu marketingowego. Słowo skoring pochodzi oczywiście od scores, czyli punkty. Klasyfikacja skoringowa polega na przyporządkowywaniu klientów do grup ze względu na ich potencjalną wartość marketingową. Na przykład o słabym, średnim i wysokim potencjale akceptacji nowych ofert. Ja pewnie dostałem duży skoring, skoro zadzwoniono do mnie z nową ofertą.

Pampersy obok piwa

Do dopełnienia obrazu potrzebne są jeszcze dwa elementy. Pierwszy to komputer i specjalistyczny program, obliczający wartości prawdopodobieństw na podstawie dostępnych danych. Większość dużych firm wyposażona jest w całe systemy analizowania danych. Bardzo często analiza taka przebiega automatycznie.

Drugi element systemu analizowania danych to procedura pozwalająca na połączenie zdobytej wiedzy z konkretnymi klientami. W przypadku sieci komórkowych dane na temat klientów są już dostępne w systemie informatycznym firmy. Wystarczy tylko je wykorzystać. Jeżeli jednak takich danych nie ma, to można spróbować je zdobyć. Powszechną metodą jest wprowadz...

Ten artykuł dostępny jest tylko dla Prenumeratorów.

Sprawdź, co zyskasz, kupując prenumeratę.

Zobacz więcej

Przypisy