1 / 26

Personalizácia v otvorenom informačnom priestore: vylepšený proxy server

Personalizácia v otvorenom informačnom priestore: vylepšený proxy server. Onto žúr , 5 .1 2 .2008. Michal Barla, Jozef Tomek. Cieľ prezentácie. Informovať Vás o platforme, ktorá sa u nás vyvíja na a ktorá pre vás môže byť zaujímavá ak: riešite /vyp ísali ste /chcete vyp ísať

ninon
Download Presentation

Personalizácia v otvorenom informačnom priestore: vylepšený proxy server

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Personalizácia v otvorenom informačnom priestore: vylepšený proxy server Ontožúr, 5.12.2008 Michal Barla, Jozef Tomek

  2. Cieľ prezentácie • Informovať Vás o platforme, ktorá sa u nás vyvíja na a ktorá pre vás môže byť zaujímavá ak: • riešite/vypísali ste/chcete vypísať • BP/DP/DizP (a vidím potenciál aj na OPčka) v oblastiach • modelovanie používateľa, personalizácia a prispôsobovanie, kolaboratívne správanie a odporúčanie, sociálne siete, klasifikácia (stránok, používateľov), analýza textu, ...

  3. Štruktúra prezentácie • Motivácia • Čo ponúkame • Čo potrebujeme • Čo chcete...

  4. Zatvorený informačný priestor • Problémy s datasetmi pre používateľské štúdie • Aktuálnosť • Úplnosť • Konzistentnosť • S čím sa porovnať? • Ako motivovať ľudí, aby určitý typ informácií nehľadali na googli ale v našom prehliadači? • Prelomiť návyky, pluginy, extensions, lenivosť

  5. Čo ponúkame

  6. Proxy server • Brána do otvoreného informačného priestoru • Neviažeme sa na jednu doménu • Doménou je vyhľadávanie informácií • Nemeníme návyky ľudí v práci s webom • Aspoň nie skokovo • Vieme sa porovnať s googlom etc. • Prirodzený baseline

  7. Proxy server – body interakcie

  8. Všeobecný princíp interakcií • Proxy zodpovedné za logovanie akcií • Dva typy handlerov • Request • Response • Špeciálne vs. generické • Pre stránku xyz.ab, vyhľadávač abc.xy • Pre ľubovoľnú stránku • Proxy „zobudí“ každý relevantný handler • observer

  9. Proxy server – úvodná stránka

  10. Ukážka úvodnej stránky open source proxy servercapistrano tutorialapache administration • Recent searches of your community : • open corpus adaptive hypermedia • collaborative searching • keyword user model hierarchy

  11. SearchPageResponse • getDOMForPage() • setDOMForPage(DOM document) • addRef(title-url pair) • addList(String title, List<title-url pairs> urls)

  12. Proxy server – dopyt pre vyhľadávač

  13. SearchForKeywordRequest • getSearchString() • setSearchString(String) • Má zmysel toto nejako parsovať na strane proxy? • List<String> getSearchKeywords()

  14. SearchForKeywordRequest • Zalogujeme • User (trackingCookie, IP address…?) • search string (rozparsovane keywords) • search engine • timestamp

  15. Proxy server – výsledky

  16. Odpoveď z vyhľadávača

  17. SearchForKeywordsResponse • int getResultCount() • List<Result> getListOfResults(int page) • List<Result> getListOfResults(int maxpages) • List<Result> getListOfResults(int minPage, int maxPage) • Result: • URL, pozícia, opis • Vedeli by sme vytiahnuť z DB klikanosť, obľúbenosť (v nejakej komunite?), ...

  18. SearchForKeywordsResponse • addResult(Result PageReference, int position) • Remove/Hide(int position) • emphasize(int position, Level) /*+ aj - */ • annotate(int position, AnnotationType type) • setPosition(int oldPosition, int newPosition) • swapPositions(int position_a, int position_b)

  19. SearchForKeywordsResponse • K používateľovi a hľadaným kľúčovým slovám prilogujeme • Zobrazené výsledky (url, pozícia) • Kliknutý výsledok (url, pozícia)

  20. Proxy server – body interakcie

  21. Ukážka stránky

  22. PageResponse • getDOMForPage() • setDOMForPage(DOM document) • emphasize(Node, Level) • ?Annotate(Node, Level)

  23. PageResponse • Zalogujeme • Čas strávený na stránke • Vieme zalogovať akúkoľvek udalosť generovanú prehliadačom • Odkaz na JavaScript vložený do hlavičky každej stránky • Asynchrónne reporty na server • Špeciálny User-Agent zabezpečí nepreposlanie reportu ďalej smerom k samotnej stránke

  24. Proxy server – technická stránka • Základom RabbIT web proxy • Java-based • Podporujúce HTTP štandardy • Živý projekt (v3.16updated: aug 11 2008) • Robustné, rýchle (aspoň si to myslíme) • Java NIO • Prezentovaná funkcionalita implementovaná pre vybrané webové vyhľadávače • S možnosťou dokódiť si ďalšie 

  25. Čo potrebujeme/budeme potrebovať • Spätnú väzbu • Ak viacero ľudí potrebuje rovnakú vec, možno by sa mohla stať súčasťou API, službou proxy • Používateľov • Ktorí cez to budú surfovať • Ktorí do toho zapoja svoje UMAP, Text Mining a ďalšie metódy (BP, DP, OP) • Prispievateľov (BP, OP, free time ) • Rozšírenie funkcionality na ďalší vyhľadávač • Manažment používateľov, vzťahov, logov, ...

  26. Proxy server – body interakcie

More Related