SlideShare une entreprise Scribd logo
Spring Batch
Mardi 14 Mai 2013
Paris JUG
Olivier Bazoud
Julien Jakubowski
Julien Jakubowski @jak78
Java depuis > 10 ans
Spécialisé Java EE / Spring
Vos réactions: #springbatch #parisjug
Intervenants
Olivier Bazoud @obazoud
Architecte technique sénior
Java EE / Spring, Spring Batch, NoSQL, Node.js
Co-auteur de « Spring Batch in Action »
De quoi va-t-on parler ce soir ?
•  On va parler de batchs en Java
•  … et aussi de bière
http://www.flickr.com/photos/fromeyetopixel/2559391584/
Nos objectifs
En sortant de la salle, vous savez:
 Si Spring Batch est utile pour vous (ou pas)
 Les notions principales de Spring Batch
… et quelques notions avancées
 Faire un batch « Spring Batch » dès demain
https://github.com/obazoud/spring-batch-sug
Batch : de quoi parle-t-on ?
Batch processing = répétition de traitements sur un
ensemble de données…
Batch : de quoi parle-t-on ?
… potentiellement grands volumes…
http://www.flickr.com/photos/claudiasofia99/2878579560/
Batch : de quoi parle-t-on ?
… sans intervention d’un utilisateur humain – pas
d’interface homme-machine
Batch : de quoi parle-t-on ?
batch ≠ scheduler
Problèmes récurrents
•  Fiabilité
Problèmes récurrents
•  Maintenabilité
Problèmes récurrents
•  Réinvention de la roue… carrée
Spring Batch propose…
•  Un cadre
•  Un vocabulaire (domain language)
•  Traitement par lots
•  Flow, Reprise sur erreur, …
•  Spring dans ses batchs
•  …
Parallélisme
Partitionnement
Spring Batch Admin
Spring Batch
Notions de base
BeerBatch
•  Ecrire la date de début du batch
•  Lire le fichier XML de recettes, au format BeerXML
•  Ecrire en base de données
Spring Batch ParisJUG
Schéma du batch
RecipeStep
InitialStep
Ecrit une date dans un log
Chunk oriented tasklet
ItemReader ItemWriterItemProcessor
Tasklet
RecipeStep
InitialStep
Chunk oriented tasklet
ItemReader ItemProcessor ItemWriter
Ecrit une date dans un log
Tasklet
•  Besoin
–  Effectuer 1 tâche unitaire
•  Exemples
–  Unzip d’un fichier
–  Ecrire une date dans un log
–  …
ItemReader
RecipeStep
InitialStep
InitialTasklet
Chunk oriented tasklet
ItemReader ItemWriterItemProcessorItemReader
ItemReader
•  Besoin
–  Lire le XML de recettes
•  ItemReader
–  Fournit des items en entrée
Morceaux de code
ItemProcessor
RecipeStep
InitialStep
InitialTasklet
Chunk oriented tasklet
ItemReader ItemWriterItemProcessor
ItemProcessor
•  Besoin
–  Transforme, valide et / ou filtre une recette
•  ItemProcessor
–  Transforme un item en un autre
–  Filtrer ou rejeter un item
–  Emplacement pour les « règles métier »
ItemWriter
RecipeStep
InitialStep
InitialTasklet
Chunk oriented tasklet
ItemReader ItemProcessor ItemWriter
ItemWriter
•  Besoin
–  Décharge les bières dans une base SQL
•  ItemWriter
–  Ecrit les items
Chunk
RecipeStep
InitialStep
InitialTasklet
Chunk oriented tasklet
ItemReader ItemProcessor ItemWriter
Chunk
•  Besoin
–  Lire, transformer et écrire
•  Chunk
–  Lit et transforme chaque recette successivement
–  Ecrit les recettes, par lot
Chunk
Taille du lot = commit interval = 2
Step
RecipeStep
InitialStep
Chunk oriented tasklet
ItemReader ItemProcessor ItemWriter
InitialTasklet
Step
•  Besoin
–  Etape dans le processus du batch
–  Contrôle le workflow
Job
RecipeStep
InitialStep
Chunk oriented tasklet
ItemReader ItemProcessor ItemWriter
InitialTasklet
Job
•  Besoin
–  Décrire les étapes du batch
–  Composé d’un ou plusieurs steps
Spring Tools Suite
Tests automatisés
•  Coder un batch en TDD
•  Tests d'intégration facilités
https://github.com/obazoud/spring-batch-sug
Forces et faiblesses
✔  Batchs complexes mieux maintenables
✔  Productivité
✔  Tests
✗  Ticket d'entrée
✗  Ne convient pas à tous les batchs
Retour d’expérience
Ekino
•  Avec « Spring Batch »
–  Moins de code produit
–  Plus de tests unitaires & intégrations
–  Spring Batch s'occupe de la montée en charge
–  SQL/MyBatis
•  Gain par rapport à un batch « legacy »
–  XML 100Mo + SQL; Gain : de 60 mn à 8mn
–  10 fichiers 4Mo + SQL; Gain : de 10mn à 1mn30s
–  20 fois rapide qu’un batch en … PHP ;)
JSR-352 « javax.batch »
Ressemble beaucoup à
Spring Batch
Spring Batch
Allons plus loin
Un batch plus robuste
Flow
Scaling
http://www.flickr.com/photos/claudiasofia99/2878579560/
Monitoring
Spring Batch Admin
Un batch plus robuste
reprise sur erreurs
Reprise sur erreur
•  Spring Batch « out-of-the-box » propose:
– Sauter les erreurs non bloquantes (skip)
•  survivre à quelques données invalides
– Recommencer un traitement (retry)
•  survivre à une indisponibilité temporaire
– Redémarrer un batch (restart)
•  on est en mesure de le relancer
Reprise sur erreur: Skip
•  Par défaut, au-delà du « skip-limit », failed
0001;ABC;DEF;
0002;ABC;DEF;
000zxjgxdjghjsdfkud
0004;ABC;DEF;
Reprise sur erreur: Retry
Reprise sur erreur: Retry
•  Relancer une opération si indisponibilité
•  Par défaut, au-delà du « retry-limit », failed
•  Personnaliser le « retry »
– RetryPolicy
– Stratégie entre 2 « retry »: BackoffPolicy
•  RetryListener pour écouter
Reprise sur erreur: Restart
Reprise sur erreur:
Restart
•  Spring batch stocke des méta data
Reprise sur erreur:
Restart
•  Indique si le job est « restartable »
•  Indique le nombre max de « restart »
•  Reader/Writer doivent être « restartable »
Reprise sur erreur
Conclusion
•  Ecarter des items défectueux (skip)
•  Recommencer une step s’il y a une erreur
temporaire (retry)
•  Redémarrer un job (restart)
Flow
Gestion du flow
•  Exemple plus simple ;)
StepA
StepB
StepAlert
FAILED
*
Gestion du flow
Gestion du flow
•  Status
– Etat du job/step en cours/après d’exécution
•  Créer et utiliser ses propres « status »
•  Gérer le flow
– StepExecutionListener
– JobDecider
Scaling
http://www.flickr.com/photos/claudiasofia99/2878579560/
Scaling
Horizontal Scaling
•  RabbitMQ: Message-Oriented Middleware
– Découpler le producteur des consommateurs
•  Batch Orienté Tâche ou Worker
Horizontal Scaling
Worker	
  
Batch	
  
Worker	
  
Batch	
  
Spring	
  Batch	
  
Worker	
  
Batch	
  
AMQP	
  
Spring	
  Integra6on	
  
Exchange	
  
Queue	
  
Batch	
  
Spring	
  Batch	
   Spring	
  Batch	
  
AMQP	
  
Spring	
  Integra6on	
  
Scaling
•  Si un ItemProcessor est « lent »
•  ItemProcessor en asynchrone
•  ItemWriter attend la fin des processors
•  AsyncItemProcessor / AsyncItemWriter
Scaling
•  Multi-threaded Step (Local)
– Une Step est multithreaded
•  Parallel Steps (Local)
– Les Steps sont exécutées en parallèle
Scaling
•  Remote Chunking of Step (Remote)
– Distribution des chunks (Horizontal Scaling)
– Reader sur les master
– Processor/Writer sur les slaves
•  Partitioning a Step (Local + Remote)
– Découpe les données suivant une clé de
partition
Monitoring
•  Graphite http://graphite.wikidot.com
Monitoring
•  Collectd
–  http://collectd.org
– démon qui recueille périodiquement des
statistiques de performance du système
•  JMXTrans
–  https://github.com/jmxtrans/jmxtrans
– Interroge les données JMX de la JVM et les
envoyer dans Graphite
Monitoring
•  Metrics
–  http://metrics.codahale.com/
– Connaitre l’intérieur de votre application
– Gauges, Counters, Meters, Histogram, Timers
•  Extension pour Spring Batch
–  https://github.com/obazoud/metrics-spring-batch
–  Bientôt sur Maven Central
Monitoring
Mode push au lieu de pull
Monitoring
Spring Batch Admin
Spring Batch Admin
•  Console Web pour Spring Batch
– « Standalone » ou « Embedded »
– API Rest
– Uploader une configuration, un fichier à traiter
– « Customisable »
– Informations sur les jobs, steps, …
Liens
•  Le code de la présentation
–  https://github.com/obazoud/spring-batch-sug
•  Spring Batch 2.1.x
–  http://static.springsource.org/spring-batch
•  Spring Batch 2.2 coming soon
•  Articles sur le web
–  http://www.theserverside.com/news/1363855/Spring-Batch-Overview
–  http://www.infoq.com/presentations/syer-introducing-spring-batch
–  http://blog.zenika.com/index.php?post/2010/03/05/To-batch-or-not-to-
batch
–  http://blog.octo.com/spring-batch-par-quel-bout-le-prendre/

Contenu connexe

Tendances (20)

PPTX
Workshop Spring - Session 4 - Spring Batch
Antoine Rey
 
PDF
Spring 3 en production
Julien Dubois
 
PPTX
Workshop Spring - Session 1 - L'offre Spring et les bases
Antoine Rey
 
PPTX
Quoi de neuf à Devoxx France 2017 ?
Antoine Rey
 
PDF
Node.js, le pavé dans la mare
Valtech
 
PPTX
Nouveautés de java 8
Florian Beaufumé
 
PPTX
Retours Devoxx France 2016
Antoine Rey
 
PDF
Backday xebia - Chercher la performance efficacement
Publicis Sapient Engineering
 
PPTX
Introduction à spring boot
Antoine Rey
 
PPTX
Promises Javascript
Julien CROUZET
 
PDF
DevOps avec Ansible et Docker
Stephane Manciot
 
PPTX
Introduction à React JS
Abdoulaye Dieng
 
PDF
Hibernate vs le_cloud_computing
Ippon
 
PPTX
Spring & SpringBatch FR
Marouan MOHAMED
 
PDF
Hibernate vs le Cloud computing
Julien Dubois
 
PDF
Cours JavaScript
Soufiene Bouzid
 
PDF
Voxxeddays lux 2018 apres java 8, java 9 et 10
Jean-Michel Doudoux
 
PDF
Voxxdays luxembourg 2016 retours java 8
Jean-Michel Doudoux
 
PPT
De Maven à SBT ScalaIO 2013
Stephane Manciot
 
PDF
Spring Meetup Paris - Back to the basics of Spring (Boot)
Eric SIBER
 
Workshop Spring - Session 4 - Spring Batch
Antoine Rey
 
Spring 3 en production
Julien Dubois
 
Workshop Spring - Session 1 - L'offre Spring et les bases
Antoine Rey
 
Quoi de neuf à Devoxx France 2017 ?
Antoine Rey
 
Node.js, le pavé dans la mare
Valtech
 
Nouveautés de java 8
Florian Beaufumé
 
Retours Devoxx France 2016
Antoine Rey
 
Backday xebia - Chercher la performance efficacement
Publicis Sapient Engineering
 
Introduction à spring boot
Antoine Rey
 
Promises Javascript
Julien CROUZET
 
DevOps avec Ansible et Docker
Stephane Manciot
 
Introduction à React JS
Abdoulaye Dieng
 
Hibernate vs le_cloud_computing
Ippon
 
Spring & SpringBatch FR
Marouan MOHAMED
 
Hibernate vs le Cloud computing
Julien Dubois
 
Cours JavaScript
Soufiene Bouzid
 
Voxxeddays lux 2018 apres java 8, java 9 et 10
Jean-Michel Doudoux
 
Voxxdays luxembourg 2016 retours java 8
Jean-Michel Doudoux
 
De Maven à SBT ScalaIO 2013
Stephane Manciot
 
Spring Meetup Paris - Back to the basics of Spring (Boot)
Eric SIBER
 

En vedette (20)

PPT
Devoxx test ng
Romain Linsolas
 
PPTX
Comparatif des frameworks js mv
Mael Monnier
 
PDF
IFA livre anniversaire 2001-2011 F
evertjanlammers
 
PDF
18 bellini et atelier la déploration sur le christ mort_bondetti
seminaire_venitien
 
PPTX
Guy debaux
Domergue François
 
PDF
Biotech & Finances 10 09 12
Vincent Genet
 
PPTX
Espace communautaire Ecomouv (demo)
adrien_wiesenbach
 
PDF
Tema 2 segunda_parte_genero
Marta Jaén
 
PDF
Ley Orgánica2012
majoteros
 
PDF
HotelsCombined - Présentation générale
mhuynh
 
PDF
Yo conozco mi herencia
Mercedes Casuso
 
PDF
Rapport surface foliaire et poids de recolte
Riccagioia Scpa
 
PPTX
Ppt
pagal00
 
PDF
Programme du festival Arelate 2012
Sarah Rebouh
 
PPS
Urgente
Carlos Posada
 
PDF
Cloisters
jonvano31
 
PPTX
Atelier at5 ressources ent
MATICE_CDP
 
PDF
10 bis prédelle du rétable de san zenon roy
seminaire_venitien
 
PDF
Developpement produit creativite_pe_chausse
Pierre-Etienne Chausse
 
Devoxx test ng
Romain Linsolas
 
Comparatif des frameworks js mv
Mael Monnier
 
IFA livre anniversaire 2001-2011 F
evertjanlammers
 
18 bellini et atelier la déploration sur le christ mort_bondetti
seminaire_venitien
 
Guy debaux
Domergue François
 
Biotech & Finances 10 09 12
Vincent Genet
 
Espace communautaire Ecomouv (demo)
adrien_wiesenbach
 
Tema 2 segunda_parte_genero
Marta Jaén
 
Ley Orgánica2012
majoteros
 
HotelsCombined - Présentation générale
mhuynh
 
Yo conozco mi herencia
Mercedes Casuso
 
Rapport surface foliaire et poids de recolte
Riccagioia Scpa
 
Ppt
pagal00
 
Programme du festival Arelate 2012
Sarah Rebouh
 
Urgente
Carlos Posada
 
Cloisters
jonvano31
 
Atelier at5 ressources ent
MATICE_CDP
 
10 bis prédelle du rétable de san zenon roy
seminaire_venitien
 
Developpement produit creativite_pe_chausse
Pierre-Etienne Chausse
 
Publicité

Similaire à Spring Batch ParisJUG (20)

PDF
Spring Batch - Julien Jakubowski - November 2010
JUG Lausanne
 
PDF
Spring Batch
victor_gallet
 
PDF
Sug spring batch
Julien Jakubowski
 
PPTX
Introduction au Spring microservices Batch.pptx
YounessABOUQORA
 
PPTX
Introduction au Spring Batch pour microservices.pptx
YounessABOUQORA
 
PPTX
Introduction au Spring Batch pour microservices.pptx
YounessABOUQORA
 
PPTX
Introduction au Spring Batch pour microservices.pptx
YounessABOUQORA
 
PDF
BigData_Chp3: Data Processing
Lilia Sfaxi
 
PDF
Synchroniser ses applis simplement avec akeneo/batch
gplanchat
 
PDF
Apache Flink par Bilal Baltagi Paris Spark Meetup Dec 2015
Modern Data Stack France
 
PDF
Spring Batch
Kokou Gaglo
 
PPTX
Perfug BOF devoxx2017.pptx
Marc Bojoly
 
PPT
Presentation Spring, Spring MVC
Nathaniel Richand
 
PPTX
Ces outils qui vous font gagner du temps
Antoine Rey
 
PDF
Formation Spring Avancé gratuite par Ippon 2014
Ippon
 
PPTX
Apache flink - prise en main rapide
Bilal Baltagi
 
PDF
Chaine de production pipeline
Nicolas wallerand
 
PPTX
Presentation des outils traitements distribues
Lê Anh
 
PDF
Support de cours EJB 3 version complète Par Mr Youssfi, ENSET, Université Ha...
ENSET, Université Hassan II Casablanca
 
PPT
Symphonie pour PHP industrialisé en agilité majeure
Jonathan Bonzy
 
Spring Batch - Julien Jakubowski - November 2010
JUG Lausanne
 
Spring Batch
victor_gallet
 
Sug spring batch
Julien Jakubowski
 
Introduction au Spring microservices Batch.pptx
YounessABOUQORA
 
Introduction au Spring Batch pour microservices.pptx
YounessABOUQORA
 
Introduction au Spring Batch pour microservices.pptx
YounessABOUQORA
 
Introduction au Spring Batch pour microservices.pptx
YounessABOUQORA
 
BigData_Chp3: Data Processing
Lilia Sfaxi
 
Synchroniser ses applis simplement avec akeneo/batch
gplanchat
 
Apache Flink par Bilal Baltagi Paris Spark Meetup Dec 2015
Modern Data Stack France
 
Spring Batch
Kokou Gaglo
 
Perfug BOF devoxx2017.pptx
Marc Bojoly
 
Presentation Spring, Spring MVC
Nathaniel Richand
 
Ces outils qui vous font gagner du temps
Antoine Rey
 
Formation Spring Avancé gratuite par Ippon 2014
Ippon
 
Apache flink - prise en main rapide
Bilal Baltagi
 
Chaine de production pipeline
Nicolas wallerand
 
Presentation des outils traitements distribues
Lê Anh
 
Support de cours EJB 3 version complète Par Mr Youssfi, ENSET, Université Ha...
ENSET, Université Hassan II Casablanca
 
Symphonie pour PHP industrialisé en agilité majeure
Jonathan Bonzy
 
Publicité

Spring Batch ParisJUG