Le vocabulaire du Big Data Comme pour toute nouvelle technologie, le Big Data apporte son lot de nouveaux termes. Certains sont nés dans le cerveau des développeurs, d’autres viennent de la statistique.
3V : Volume, Vitesse, variété, c’est, selon les consultants, les trois critères clés qui définissent une plateforme Big Data. Le volume est le critère le plus souvent évoqué, avec la capacité de traiter des To voire des Po de données, mais ce n’est pas le seul. Le critère vitesse est important pour bon nombre d’applications Big Data dont certaines sont temps réel, le critère variété évoque la capacité d’un système à pouvoir traiter des données hétérogènes et non structurées. A ces 3V initiaux, certains ont ajouté le V de Valeur et le V de véracité.
Algorithmes : Si dans le Big Data, la donnée est le sang du système, le moteur d’intégration de données, le cœur, les algorithmes en sont le cerveau. Ce sont les algorithmes, basés sur les statistiques, l’intelligence artificielle qui analysent les données.
Algorithmes de Boosting : Les algorithmes de Boosting ou encore de stratégies adaptatives sont une classe d’algorithmes de Machine Learning permettant d’améliorer la précision d’algorithme peu précis.
Algorithmes génétiques : Algorithmes calqués sur les principes des évolutions génétiques d’une population et permettant d’améliorer une solution par calculs successives, comme des générations de populations, jusqu’à arriver à un optimum.
Analyse discriminante linéaire : Algorithme prédictif permettant de classifier un individu dans un segment.
la suite : Le vocabulaire du Big Data – JDN [www.journaldunet.com]