pourquoi le big data open source ?
DESCRIPTION
TRANSCRIPT
Le GTLL face au défidu déluge des données
Stefane Fermigier, Data Tuesday, fév. 2013
There is a tsunami of data that is crashing onto the beaches of the civilized world. This is a tidal wave of unrelated, growing data formed in bits
and bytes, coming in an unorganized, uncontrolled, incoherent cacophony of foam. It's filled with flotsam and jetsam. It's filled with the sticks and bones and shells of inanimate and
animate life. None of it is easily related, none of it comes with any organizational methodology.
Richard Saul Wurman, in “Information Architects” (1996)
Pourquoi le big dataopen source ?
Facteurs économiques
Source: Michael Driscoll
Facteur technique
Pourquoi le big dataopen source ?
• Expertise historique en scalabilité horizontale (cf. Beowulf, Google, etc.)
• Majors de l’internet (cf. Google, Yahoo!, Facebook, Twitter) imprégnés de culture open source, et dont le business model tourne autour de l’accumulation des données
• Efficience de l’open source comme modèle d’innovation ouverte, de développement et de diffusion de l’innovation
Mission du GT
“Développer l’écosystème du Libreen Ile-de-France”
65 PME/ETI
17 Grands Groupes
28 Etablissementsde Recherche et Formation
Distributed / Cloud Embedded
Roadmap technologique
Distributed / Cloud Embedded
Dev. Tools Middleware Big / Open Data
Roadmap technologique
Web 2.0 / 3.0 Enterprise Apps
Distributed / Cloud Embedded
Dev. Tools Middleware Big / Open Data
Roadmap technologique
Projets: 33Effort: 140 M€Aide: 52 M€
R&D collaborative depuis 5 ans
3 “grands défis”
• Qualité logicielle
• “After PC”
• Déluge des données
Focus sur le Big Data
Stockage (NoSQL, NewSQL)
Traitement (MapReduce, etc.)
Indexation
Collecte & injection
Infra & sys. management
Data Viz
Plus d’infos
Livre blanc disponiblesur www.fermigier.com
Site Web:www.gt-logiciel-libre.org