Hands-On Spark

Pour ce premier Hands-On Duchess de l’année vous proposons de venir découvrir Apache Spark le 10 mars dans les locaux de Blablacar lors d’une session de code en Java et/ou Scala (à vous de choisir ! les deux seront disponibles). Les inscriptions sur font sur Meetup.

****

Spark, c’est quoi ?

Apache Spark est un projet open source, codé en Scala et initialement créé a l’universite de Californie à Berkeley en 2009.

C’est un framework qui permet de faire de l’analytics sur de gros volumes de données en faisant ses traitements principalement en mémoire mais aussi sur disque, avec des performances largement supérieures à la plupart des outlis Big Data, comme Hadoop.

Spark est particulièrement intéressant pour des traitement itératifs, que l’on retrouve beaucoup en Machine Learning.

La soirée

Le but de ce Hands-On est de vous faire manipuler l’API de Spark, son shell, et découvrir les API de l’écosystème de Spark : Spark SQL, MLlib (Machine Learning) et Spark streaming au travers de plusieurs exercices.

Le Hands-On sera disponible en Java et Scala.

Prérequis pour la soirée

Java 8 (pour bénéficier des lambda expression), si vous voulez coder en Java
Scala, pour ceux qui veulent utiliser l’API Scala
un IDE (intelliJ, eclipse…) et Maven installé
Une machine avec au
moins 4Go de RAM

Le pair-programming sera largement encouragée lors de cette soirée, donc pas de panique si vous oubliez votre laptop !

Speakers

Ludwine Probst est Data Engineer chez Cityzen Data, où elle travaille sur du Machine Learning et du traitement de gros volumes de données temps réel notamment avec Spark.

Sam Bessalah est développeur freelance passionné de systèmes distribués, et de tout ce qui tourne autour de la data. Il co-organise le meetup du Paris Datageeks.

Rendez-vous le 10 mars chez Blablacar avec votre laptop à partir de 19h15. La soirée débutera à 19h30 précise !

****

Merci à notre hôte Blablacar de nous accueillir et nous offrir boissons et pizzas.