Podczas kolejnej edycji TechTalk with Capgemini będzie można wysłuchać wykładu Wikipedia analysis with spark oraz zapoznać się z niektórymi projektami prowadzonymi przez naszą firmę.
➡TechTalk: Wikipedia analysis with spark⬅
Wikipedia to w dzisiejszych czasach jedno z najważniejszych źródeł wiedzy. Codziennie około 14mln użytkowników korzysta z tego narzędzia, a liczba artykułów w języku angielskim osiągnie w najbliższym czasie 5 milionów. Wikipedia staje się tym samym wspaniałym źródłem do analizy ruchu sieciowego. Czy uda nam się rozpoznać typowe wzorce zachowań użytkowników? Czy dowiemy się, które artykuły warto współtworzyć, aby zostać rozpoznawalnym redaktorem Wikipedii?
Specjaliści Capgemini codziennie zmagają się z analizą dużych zbiorów danych. Jeśli chcesz się dowiedzieć, jak przy pomocy narzędzi Big Data (Amazon S3, Apache Spark, Apache Zeppelin) można w szybki sposób przeprowadzić analizę eksploracyjną logów Wikipedii, zapraszamy. Będziemy programować, bawić się danymi, tworzyć raporty. Będzie ciekawie, miejscami bardzo technicznie, ale przede wszystkim praktycznie.
Claim the event and start manage its content.
I am the organizer