Home » A la Une, Logiciels, Open Source » Hadoop est une nouvelle façon pour les entreprises de stocker et analyser les données

Hadoop est une nouvelle façon pour les entreprises de stocker et analyser les données

Hadoop est un projet open-source géré par Apache Software Foundation. Les contributeurs Hadoop travaillent pour les plus grandes sociétés de technologie du monde. Cette communauté diverse et motivée a produit une véritable plate-forme innovatrice pour la  consolidation, la   combinaison et la compréhension des données.

Les entreprises d’aujourd’huicollectent et génèrent beaucoup plus de données qu’auparavant. Les produits de Data warehouse et des De données relationnelles sont meilleurs pour les transactions OLAP & OLTP que pour des  données   structurées. Hadoop,  cependant, a été conçu pour résoudre un autre problème: l’analyse rapide et fiable des données  structurées et complexes. Par conséquence, de nombreuses  entreprises ont choisi de déployer Hadoop aux côtés de leurs  systèmes informatiques existants, ce qui leur  permet de combiner les  anciens et les nouveaux ensembles  de données d’une manière très efficace.

Techniquement, Hadoop se compose  de deux services clés: stockage fiable de données en utilisant  Hadoop Distributed File System (HDFS) et traitement parallèle de  données à hautes   performances en  utilisant une technique appelée MapReduce.

Facebook ingère 15 térabytes de nouvelles données par jour dans leurs 2,5 petabytes (10^15 octets) data warehouse sous Hadoop.

Hadoop fonctionne avec une collection de produits de base, les  serveurs shared-nothing (les machines sont similaires et interchangeables). Vous pouvez ajouter ou supprimer des serveurs d’un  noeud Hadoop à volonté. Ainsi, en  cas de défaillance, le traitement est immédiatement reporté sur une  autre unité du noeud. Il en est de même pour le stockage. Un ensemble de données n’est pas nécessairement stocké sur une machine spécifique. Hadoop, en  d’autres termes, fonctionne en ‘auto-guérison’. Il peut fournir des  données et peut fonctionner à grande échelle, pour un traitement des données à haute performance – en dépit des modifications du système ou des échecs.

En Mai 2009, Yahoo Corp a trié 1 téraoctet (10^12 octets) de données en 62 secondes en utilisant Hadoop

Initialement développé et utilisé par des entreprises dominantes sur le Web comme Yahoo et Facebook, Hadoop est maintenant  largement  utilisée en : finance, technologie,  télécommunications, médias et divertissement, gouvernement,  institutions de recherche et autres marchés. Avec Hadoop, les entreprises peuvent facilement explorer des données complexes utilisant des analyses  personnalisées adaptées à  leurs demandes.

  • http://blog.casablanca-technopark.ma/?p=649 CASABLANCA TECHNOPARK

    [...] Hadoop est une nouvelle façon pour les entreprises de stocker et analyser les données 5 novembre 2010 Hadoop est un projet open-source géré par Apache Software Foundation. Les contributeurs Hadoop travaillent pour les plus grandes sociétés de technologie du monde. Cette communauté diverse et motivée a produit une véritable plate-forme innovatrice pour la consolidation, la combinaison et la compréhension des données. Hadoop Les entreprises d’aujourd’huicollectent et génèrent beaucoup plus de données qu’auparavant. Les produits de Data warehouse et des De données relationnelles sont meilleurs pour les transactions OLAP & OLTP que pour des données structurées. Hadoop….Lire la suite [...]

blog comments powered by Disqus

Abonnez-vous a TechnoMag

  TechnoMag.ma flux RSS    TechnoMag.ma Lettre d'information    TechnoMag.ma sur Facebook   TechnoMag.ma sur Twitter

© 2017 TechnoMag NTIC Maroc. All Rights Reserved. Log in