Wiedza systemu o użytkowniku, jako podstawa dialogu wyszukiwawczego.

[b]Wstęp[/b] Tematem naszej prezentacji jest „Wiedza systemu o użytkowniku, jako podstawa dialogu wyszukiwawczego”. Jak widać mamy w tym tytule takie słowa jak system, użytkownik, dialog i wiedza… Pewnie każdy z nas potrafi podać przybliżoną definicje i wskazać poprawne przykłady każdego z tych elementów. Na potrzeby prezentacji ujednolićmy sobie wszystkie te definicje tak, aby ten temat stał się dla nas „lekkostrawny”. System? System – obiekt fizyczny lub abstrakcyjny, w którym można wyodrębnić zespół lub zespoły elementów wzajemnie powiązanych w układy, realizujących, jako całość funkcję nadrzędną lub zbiór takich funkcji (funkcjonalność).

[b]Wstęp[/b] Tematem naszej prezentacji jest „Wiedza systemu o użytkowniku, jako podstawa dialogu wyszukiwawczego”. Jak widać mamy w tym tytule takie słowa jak system, użytkownik, dialog i wiedza… Pewnie każdy z nas potrafi podać przybliżoną definicje i wskazać poprawne przykłady każdego z tych elementów. Na potrzeby prezentacji ujednolićmy sobie wszystkie te definicje tak, aby ten temat stał się dla nas „lekkostrawny”. System? System – obiekt fizyczny lub abstrakcyjny, w którym można wyodrębnić zespół lub zespoły elementów wzajemnie powiązanych w układy, realizujących, jako całość funkcję nadrzędną lub zbiór takich funkcji (funkcjonalność). Użytkownik? Użytkownikami jesteśmy my wszyscy.. Ludzie korzystający z pewnego systemu (niekoniecznie z tego komputerowego). Dialog? Dialog to po prostu porozumiewanie się. Najczystszy i najprostszy środek komunikacji międzyludzkiej i nie tylko, o czym przekonamy was w naszej prezentacji. Wiedza? Wiedza? To prawdziwe i uzasadnione przekonanie.

W ramach wstępu chyba powiedzieliśmy sobie najważniejsze rzeczy. Nasz temat omówimy sobie „stricte” na przykładach. Staraliśmy się, aby wszystkie te przykłady przez nas dobrane, każdy z was mógł przetestować i zaobserwować sam, w domowym zaciszu.

Nie trzymając was dłużej w niepewności przejdźmy do głównej części naszej prezentacji.   Przykłady

Jak wszyscy bardzo dobrze wiecie, Google to obecnie najpopularniejsza przeglądarka na całym świecie. Która daje nam ogromne możliwości w poszukiwaniu informacji (w każdej formie) w Internecie. Z każdym rokiem jest udoskonalana o nowe funkcjonalności bądź o nowy wygląd. Jedną z takich funkcjonalności (jednocześnie najbardziej rzucającą się w oczy) są spersonalizowane reklamy, które przeglądarka nam pokazuje po wpisaniu jakiegoś hasła np.:

Po wpisaniu prostego hasła takiego właśnie jak laptopy możemy ujrzeć stos reklam, jakimi zasypuje nas Google. Są to reklamy partnerów, wystosowane właśnie pod nas i nasze preferencje. O czym możemy się przekonać po kliknięciu, na „Dlaczego te reklamy?” w prawym górnym rogu pola reklam:

Dostęp do „Menadżera preferencji reklam” dostajemy w momencie, gdy zalogujemy się na nasze konto Gmail. Będziemy mogli tam usuwać i blokować reklamodawców, którzy naszym zdaniem nie powinni nam się już więcej pokazywać na oczy.

Wszystko pięknie, ładnie, ale jak to tak naprawdę działa? Jakim kosztem? Odpowiedź jest prosta: kosztem naszej prywatności. Otóż Google kolekcjonuje i analizuje informacje o użytkownikach ich systemu wyszukiwania. To kolekcjonerstwo jest sposobem na „uczenie się” przez wyszukiwarkę prostych informacji na temat poszczególnych użytkowników, które w dalszej części pomogą w ulepszeniu dialogu człowiek – wyszukiwarka oraz w ulepszeniu funkcjonalności. Tak argumentuje to gigant z Doliny Krzemowej w praktyce wygląda to nieco inaczej, a mianowicie: analizowane są kroki osoby wyszukującej - czy pierwszy link w wynikach wyszukiwania okazał się oferować żądane informacje, czy szukała dalej. Co należy zrobić żeby następnym razem pierwszy wynik był tym właściwym.

Wszystkie zbierane informacje o użytkowniku przechowywane są do 9 miesięcy. W ich skład wchodzą np.: o Numer IP komputera, z którego korzystamy o Frazy wpisywane w Google o Linki, jakie odwiedzamy (ustawiany jest ranking stron dzięki tej statystyce) Informacjami, jakie posiada o nas wyszukiwarka możemy zarządzać w panelu „Google Dashboard” :

Jak na razie wspomnieliśmy o samych reklamach, które pewnie nie każdy z nas lubi i odbiera je bardziej, jako spam niż coś pożytecznego. Jednakże istnieje jeszcze jedna bardzo przydatna cecha dialogu wyszukiwawczego z Google. Jest nią szeroko pojęte ułatwianie życia użytkownikowi. Prosty przykład. Znajdujemy się w pewny mieście i potrzebujemy znaleźć Hotel, w którym moglibyśmy przenocować. Niekoniecznie wiem, jakie to miasto (bo i takie sytuacje mogą nam się zdarzyć). Wystarczy, że znajdziemy i połączymy się z hot spotem i wpiszemy w wyszukiwarce hasło hotel:

Naszym oczom powinna ukazać się mapka miasta, w którym obecnie się znajdujemy. Wyszukiwarka zaznaczy na niej Hotele. Jak widać, tutaj Google skorzystało z wiedzy na temat naszej lokalizacji i podczas naszego wyszukiwania pomogło nam wskazać najbliższe hotele, w których możemy spędzić noc.
Drugim przykładem wykorzystywania wiedzy w celu ułatwienia użytkownikowi życia, będzie moment, w którym użytkownik zdecyduje się na wyszukiwanie muzyki, filmów lub też grafiki. Google, jako multiwyszukiwarka będzie wstanie wskazać po wpisaniu np. tytułu jakiejś piosenki nie tylko linki do stron gdzie nastąpiła o niej wzmianka, ale także filmy na serwisach internetowych zawierające teledysk do danego utworu. Przykład:

Google jest świetnym przykładem wykorzystania wiedzy o użytkowniku w dialogu wyszukiwawczym. Trzeba jedyni wiedzieć jak rozmawiać z naszą ulubioną wyszukiwarką. Z roku na rok dialog ten staje się o wiele prostszy i bardziej intuicyjny dla użytkownika, co powoduje, że nie musimy wkładać zbyt dużego wysiłku w wyszukanie interesującej nas informacji (niezależnie od tego, jakiej formy by ona nie była).

  W przypadku, gdy mówimy o wyszukiwarkach nie należy zignorować mniej popularnego brata google.com – bing.com.

Bing jest stworzona przez Microsoft wyszukiwarka internetowa. Właściwie jej polityka prywatności nie różni się niczym od polityki, którą prezentuje Google. Znaczącą różnicą jest jedynie okres przechowywania informacji o użytkowniku. Bing potrzebuje je tylko na pół roku. Powód przechowywania również pozostaje taki sam jak w przypadku google.pl Działanie Binga jest jednak znacznie uboższe od działania wyszukiwarki giganta z doliny krzemowej. Jednakże również istnieje możliwość spersonalizowania dialogu wyszukiwawczego, lecz podkreślam jeszcze raz: jest on znacznie uboższy niż mechanizm proponowany przez Google. Na zakończenie mojej części chciałbym przytoczyć pewną sentencje Erika Schmidta, szefa koncernu Google odnosząc się do przechowywania informacji o nas przez wyszukiwarki: “Jeśli robisz coś, co chciałbyś ukryć przed innymi, to może w ogóle nie powinieneś tego robić?” Myślę, że warto się nad tym zastanowić.

  [b]Wiedza portali społecznościowych o użytkowniku jako sposób na lepsze wyszukiwanie[/b] Facebook.com

W dzisiejszych czasach ogromne znaczenie ma zbieranie informacji o użytkownikach przez wszelkiego rodzaju aplikacje i portale internetowe. Szczególnie istotne jest to w serwisach społecznościowych gdzie bazując na zachowaniu użytkownika i wiedzy na jego temat możliwe staje się zaoferowanie klientom usług zupełnie nowej jakości (czasami kosztem ich prywatności).

Pionierem ostatnich lat stał się portal społecznościowy Facebook.com, który wdrożył i stale wdraża bardzo zaawansowane algorytmy zbierające dane o użytkownikach, ich zachowaniu, relacjach jakie łączą tych użytkowników z innymi. Pozawala to na inteligentny dialog wyszukiwawczy z osobą korzystającą z tego portalu.

Główną cechą Facebooka jest łączenie ludzi, a zatem tworzenie sieci znajomych. Nowy użytkownik rejestrujący się w tym portalu jest praktycznie od pierwszych kroków bombardowany dużą ilością informacji i propozycji sugerujących, że może znać dane osoby już zarejestrowane na Facebooku.

OpenGraph

Rejestrując się w portalu system zna nasz adres email. Tylko na samej tej podstawie może już zasugerować nam osoby, które moglibyśmy znać ponieważ nasi potencjalni znajomi mogli udostępnić nasz adres email Facebookowi. Przykładowo jeśli inny użytkownik Facebooka udostępnił dostęp do swojej skrzynki mailowej celem wyszukania swoich znajomych, Facebook zapamiętuje informacje i może podpowiedzieć tej osoby gdy któryś z jego znajomych zarejestruje się w przyszłości na Facebooku. Działa to również w drugą stronę, czyli tak jak zasugerowano na początku akapitu.

Tak prosty przykład to dopiero początek możliwości jakie daje zbieranie szerszej wiedzy o użytkowniku. Przeważnie większość osób w portalach społecznościowych udostępnia takie informacje jak imię nazwisko, wykształcenie, miejsce zamieszkania, pracy, telefon, miejsce swojej aktualnej lokalizacji (czasem nieświadomie, bowiem już samo zalogowanie się z danego komputera/smartphone’a daje informację z jakiego regionu jest dany adres IP). A to przecież nie wszystkie możliwości.

„Lubię to!” Bardzo popularnym narzędziem stał się przycisk „Lubię to!”.

W ten sposób sami użytkownicy dostarczają ogromnej ilości informacji o sobie czyli co lubią, jakie strony odwiedzają.

Timeline i ulepszona funkcja „Lubię to!” Pod koniec września 2011 Facebook rozpoczął wprowadzanie nowych rewolucyjnych funkcjonalności takich jak Timeline. Na linii czasu zaprezentuje to, co robiliśmy, np. słuchaną muzykę, ugotowane dania, trasy pokonane w czasie porannego joggingu itd. W tym celu rozszerzono również możliwości przycisku „Lubię to!”. Teraz developerzy aplikacji i stron internetowych sami mogą projektować różnego rodzaju czynności.

W jaki sposób ma się to przełożyć na poprawę dialogu wyszukiwawczego? A no daje to multum możliwości. Teraz zbierając informacje o różnych czynnościach wykonywanych lub planowanych przez użytkownika możemy mu zasugerować ciekawe wydarzenia np. koncerty, kurs gotowania odbywający się w jego okolicy. Daje to również duże pole do popisu reklamodawcom, którzy będą mogli kupować jeszcze lepiej targetowane kampanie reklamowe na Facebooku.

Sam model działania ulepszonego przycisku „Lubię to” idealnie przedstawia ilustracja.

  Od strony developera projektowanie różnych akcji wygląda tak:

  Wiedza o użytkowniku a wyszukiwanie znajomych Portal społecznościowy taki jak Facebook posiadając wiele informacji o użytkowniku jest w stanie zaoferować zaawansowane metody znajdowania osób, które mogą być powiązane z nami jakimiś relacjami. W ten sposób jesteśmy w stanie odnaleźć znajomych już zarejestrowanych w portalu, a także wyszukać ciekawe wydarzenia czy interesujące strony internetowe/fanpage.

Podpowiadania potencjalnych znajomych Już po samym zalogowaniu na Facebook są nam sugerowane osoby, które możemy znać. W tym celu wykorzystywane są informacje o użytkowniku i potencjalne relacje jakie mogą go łączyć z innymi ludźmi.

  1. Pierwszy przykład to sugerowanie nam osób, które są znajomymi naszych znajomych. Istnieje spore prawdopodobieństwo, że znamy jakichś znajomych naszych własnych znajomych. 
  2. Otrzymujemy podpowiedzi osób, które studiują na tej samej uczelni co my.
  3. Facebook podpowiada nam osoby, które chodziły do tego samego liceum.
  4. Uwzględniane są osoby, które w jakiś inny sposób możemy znać. W tym przypadku trafnie zasugerowano znajomych.

  Wyszukiwanie znajomych Jeśli sami chcemy znaleźć naszych znajomych to również wykorzystywane są informacje o nas w algorytmie generującym wyniki.

W tym przypadku szukamy osoby o imieniu Mateusz. Otrzymujemy wyniki gdzie:

Czerwona elipsa – Osoba z tego samego miasta, w którym logujemy się na Facebook. Osoba z tej samej uczelni.

Zielone podkreślenie – Osoba o imieniu Mateusz, która jest znajomym naszego znajomego.

Niebieska elipsa – Osoba, która chodziła do tego samego liceum.

Fioletowa elipsa – Facebook sugeruje nam dodatkowo ciekawe strony np. stronę aktora o imieniu Mateusz.   Innym przykładem jest próba wyszukania osoby o imieniu Marek. Dostajemy jako wynik (czerwona elipsa) osobę z naszej rodzinnej miejscowości, która jest znajomym naszego znajomego.

Ponadto Facebook sugerujemy nam strony polecane przez naszych znajomych (zielona elipsa). Jak widać wykorzystywana jest tu funkcjonalność przycisku „Lubię to!”.

Wiedza o sieci połączeń między ludźmi na Facebooku to łakomy kąsek dla marketingowców. Facebook potrafi to świetnie wykorzystać w reklamach sponsorowanych. Na poniższym obrazku widać reklamę gry, w którą gra naszych 27 znajomych.

Wiedza o użytkowniku jako kluczowy element bezpieczeństwa Wiedza na temat użytkownika jest wykorzystywana nie tylko w dialogu wyszukiwawczym. Odgrywa ona kluczową rolę w kwestii bezpieczeństwa.

Informacje o miejscu, z którego logujemy się do konta Facebook może być przydatna w momencie gdy ktoś zaloguje się na nasze konto z innego kraju. Facebook wykrywa takie incydenty uniemożliwiając dostępu obcej osobie do naszego konta. Facebook może wykorzystywać różne metody autentyfikacji użytkownika np. karze rozpoznawać znajomych po zdjęciach. Sposób iście sprytny bo obca osoba, której udałoby się zalogować na nasze konto miałaby raczej problemy z takim zadaniem.
Active Authentication - projekt systemu uwierzytelniania. DARPA (Defense Advanced Research Projects Agency) to amerykańska agencja badawcza (Agencja Zaawansowanych Obronnych Projektów Badawczych Departamentu Obrony Stanów Zjednoczonych). Jednym z najnowszych projektów tej agencji jest opracowanie nowego systemu uwierzytelniania Active Authentication wykorzystującego szczegółowe obserwacje i analizę zachowań użytkownika.

Klasyczny model dostępu do systemów informatycznych to logowanie za pomocą nazwy użytkownika i hasła. Ma on jednak pewne wady. Mianowicie jeśli ktoś przechwyci nasze dane logowania to może wykonać dowolną czynność w systemie tak jakby był osobą, do której należy konto.

Agencja DARPA postawiła sobie za zadanie opracowanie takiego systemu, który charakteryzowałby się ciągłą autentyfikacją zalogowanego użytkownika. Oznacza to, że system nad którym pracują będzie na bieżąco analizował zachowanie użytkownika.

W Active Authentication autoryzacja nigdy nie ustaje, bo nawet po wstępnym zalogowaniu się, system wciąż analizuje zachowania użytkownika i stara się ocenić, czy on to na pewno on. Ocenie mogą podlega m.in. schemat zachowania w systemie, czy specyfika pisania: tempo, specyficzne sformułowania.

Richard Guidorizzi, program manager z DARPA opisuje to tak:

„Jeśli będziesz miał mój klucz, to owszem – wejdziesz do mojego domu. Ale tam, w salonie, siedzi mój pies i on wie, że nie jesteś mną. Choćbyś trzymał ten klucz z całej siły i mówił mu, że jesteś mną, to i tak go nie przekonasz. On wie, że nie wyglądasz jak ja, nie pachniesz jak ja i nie zachowujesz się jak ja. Chcemy, by ten program zachowywał się tak samo – identyfikował twoje unikalne cechy i autoryzował cię na ich podstawie, a nie tylko w oparciu o jedną daną.”

Oczywiście, taki model nie jest absolutną nowością – systemy wykrywające anomalie w zachowaniu użytkownika stosują już m.in. banki czy niektóre serwisy internetowe (tak jak wspomniany wcześniej Facebook, który potrafi zablokować konto użytkownika, który zaloguje się z terytorium kilku odległych od siebie krajów – zakładając, że konto zostało przejęte).

DARPA chce stworzyć kompleksowe rozwiązanie, które będzie można zastosować w każdym środowisku wymagającym uwierzytelnienia. Agencja zamierza opisać ogólne zasady funkcjonowania takiego systemu i przeanalizować projekty firm czy instytucji, które zgłoszą zainteresowanie opracowaniem tego rozwiązania.

  [b]Last.fm – internetowa radiostacja oraz system muzycznych rekomendacji[/b] Last.fm to społecznościowy portal dla osób, które chcą poznać nowe zespoły muzyczne i być na bieżąco z koncertami i trasami koncertowymi swoich ulubionych zespołów.

Portal udostępnia specjalną wtyczkę Scrobbler śledzącą co użytkownik słucha. Wtyczka ta jest dostępna do różnych odtwarzaczy muzycznych np. winamp, foobar, windows media player, a także do urządzeń typu iPod, iPhone czy telefonów z odtwarzaczami muzycznymi (np. z systemem Android).

  Dialog wyszukiwawczy odbywa się w tym przypadku w postaci wysyłania przez wtyczkę Scrobbler informacji o słuchanej muzyce do portalu Last.fm. Na tej podstawie możliwa jest rekomendacja użytkownikowi zespołów, których nie zna, a które mogą mu się spodobać. Rekomendowane są również wydarzenia muzyczne odbywające się w jego okolicy.

  Oprócz dostępnych rekomendacji i wielu statystyk na stronie last.fm mamy także zwrotne informacje od systemu last.fm w samej wtyczce Scrobbler. Podczas słuchania muzyki program Scrobbler wyświetla nam informacje o zespole który słuchamy, o gatunku muzyki i podobnych zespołach.

  Wykorzystanie wiedzy o słuchanej muzyce w radiu Last.fm udostępnia swoje radio, które działa w ten sposób, że odtwarzane są w nim utwory zespołów, które mogą nas prawdopodobnie zainteresować. W rekomendacji tracklisty brane są pod uwagę zespoły, które słuchaliśmy, piosenki, które najbardziej lubimy, a także ilość odsłuchań różnych utworów, a nawet periodyczność słuchania albumów.

  Sąsiedzi muzyczni Last.fm udostępnia bardzo ciekawą funkcję o nazwie „Sąsiedzi”. Specjalny algorytm wykorzystując wiedzę o nas aby zasugerować nam osoby o podobnych gustach muzycznych. W ten sposób możemy nawiązać kontakty z wieloma ciekawymi ludźmi gustującymi w takiej muzyce jak my. A co najciekawsze dzięki temu mamy kolejną możliwość odkrywania nowej muzyki ponieważ nasi sąsiedzi są w stanie polecić nam zespoły których jeszcze nie znamy – wystarczy, że zajrzymy do ich muzycznej biblioteki.

  [b]Podsumowanie[/b] Wiedza systemów informatycznych o użytkownikach i ich zachowaniach odgrywa w dzisiejszych czasach kluczową rolę w wielu gałęziach IT. Analizowanie danych jakie generuje użytkownik poprzez swoją aktywność korzystając z aplikacji i portali internetowych pozwala na ulepszenie świadczonych usług oraz na lepszą personalizację programów pod indywidualnego użytkownika. Daje to wiele korzyści zarówno użytkownikom jak i firmom produkującym takie oprogramowanie.

Oczywiście nie ma róży bez kolców. Poprawa dialogu wyszukiwawczego odbywa się niekiedy kosztem prywatności użytkownika. Nie każdy chce aby wyszukiwarki przetrzymywały przez kilkanaście miesięcy historię wyszukiwanych przez nas informacji albo aby jakiś portal społecznościowy wykorzystywał nasze zdjęcia do reklamowania produktów naszym znajomym. Kwestia prywatności jest tutaj bardzo śliska, a większość osób nie zdaje sobie sprawy tak naprawdę ile o nich można się dowiedzieć analizując ich aktywność w sieci. Z drugiej strony chyba większość z nas wybierze wygodę korzystania z nowoczesnych aplikacji ponad anonimowość/prywatność, którą tak trudno jest dziś zachować w dobie portali społecznościowych i prób łączenia ich z klasycznymi wyszukiwarkami, czego przykładem jest tutaj Google ze swoim Google+ oraz Bing z Facebookiem.

  [b]Bibliografia[/b] http://www.lastfm.pl http://www.lastfm.pl/download http://www.lastfm.pl/community http://technologie.gazeta.pl http://www.spidersweb.pl/2011/11/darpa-nowy-pomysl-na-uwierzytelnianie.html http://netsetter.pl/co-nam-daje-wiedza-o-uzytkowniku-i-dlaczego-nalezy-ja-zbierac/ http://www.facebook.com/ http://developers.facebook.com/docs/beta/ http://www.darpa.mil/default.aspx http://www.darpa.mil/NewsEvents/Releases/2011/11/09.aspx http://www.google.pl http://www.bing.pl