 02.03.2013   Big Data: Intel annuncia Intel Distribution for Apache Hadoop

Per assicurare a più organizzazioni e persone la possibilità di utilizzare i cosiddetti "big data", le notevoli quantità di dati generati - raccolti e archiviati ogni giorno - Intel ha annunciato la disponibilità del software Intel Distribution for Apache Hadoop* (Intel Distribution). L'offerta software che include Intel manager for Apache Hadoop parte dal silicio per offrire prestazioni e sicurezza all'avanguardia.

La capacità di analizzare e interpretare i big data offre la possibilità concreta di trasformare la società favorendo nuove scoperte scientifiche, nuovi modelli di business e nuove esperienze per i consumatori. Eppure, solo una piccola percentuale di organizzazioni e aziende è oggi in grado di ricavare informazioni significative da tutti questi dati, perché le tecnologie, le tecniche e le competenze ad ora disponibili sono troppo rigide per la tipologia di dati che si analizza o troppo costose da implementare.

Hadoop è un framework open source per l'archiviazione e l'elaborazione di notevoli volumi di dati diversificati su server cluster scalabili, ritenuto ultimamente come piattaforma di riferimento per la gestione dei Big data. Con ancora più informazioni generate da miliardi di sensori e sistemi intelligenti previsti nel prossimo futuro, il framework è indispensabile che rimanga aperto e scalabile, oltre a rispondere ai requisiti elevati di prestazioni, sicurezza e gestione di fascia enterprise.

"Persone e macchine producono informazioni preziose che potrebbero arricchire la nostra vita in molti modi, dalla massima accuratezza nelle previsioni di condizioni meteorologiche critiche alla pianificazione di cure personalizzate per le patologie terminali", ha commentato Boyd Davis, Vice President e General Manager della Datacenter Software Division di Intel. "Intel è impegnata a contribuire con i miglioramenti - atti a utilizzare tutta la potenza di calcolo - a disposizione della comunità open source per fornire al settore una base più solida da cui partire per oltrepassare i limiti dell'innovazione e realizzare le opportunità di trasformazione offerte dai big data."

Prestazioni e sicurezza: la differenza Intel
Intel offre una piattaforma aperta e innovativa basata su Apache Hadoop, in grado di tenere il passo con la rapida evoluzione dell'analisi dei big data. Intel Distribution è la prima soluzione a fornire una crittografia completa con il supporto di Intel AES New Instructions (Intel AES-NI) nei processori Intel Xeon. Incorporando il supporto per la crittografia basato sul silicio del Distributed File System Hadoop, le organizzazioni possono ora analizzare con maggiore sicurezza i loro set di dati senza comprometterne le prestazioni.

Le ottimizzazioni apportate per le tecnologie di rete e di I/O nella piattaforma del processore Intel Xeon consentono inoltre di raggiungere nuovi livelli di prestazioni analitiche. L'analisi di un terabyte di dati, che in precedenza richiedeva più di quattro ore di elaborazione, può ora essere svolta in sette minuti (secondo test Intel), grazie alla combinazione della capacità di calcolo dell'hardware Intel e di Intel Distribution. Considerando che nel mondo vengono generati 1.000 terabyte o un petabyte di dati ogni 11 secondi, ovvero l'equivalente di 13 anni di video HD, la potenza della tecnologia Intel apre le porte a possibilità ancora più sorprendenti.

Ad esempio, in un ambiente ospedaliero l'intelligenza derivante da questi dati potrebbe contribuire a migliorare l'assistenza ai pazienti, consentendo agli operatori di eseguire diagnosi più rapide e accurate e a stabilire l'efficacia dei farmaci, le interazioni tra medicine, i consigli sui dosaggi e i possibili effetti collaterali tramite l'analisi di milioni di cartelle cliniche elettroniche, dati della sanità pubblica e quelli provenienti delle richieste di rimborso. Esistono delle linee guida molto rigorose per proteggere le informazioni sulla salute e sui pagamenti, imponendo la massima sicurezza e privacy durante l'esecuzione di analisi.

L'aggiunta di Intel Manager for Apache Hadoop semplifica l'installazione, la configurazione e il monitoraggio del cluster per gli amministratori di sistema che desiderano distribuire nuove applicazioni. Utilizzando Intel Active Tuner for Hadoop Software è possibile configurare automaticamente le prestazioni ottimali, senza basarsi su congetture. Finora, era necessario conoscere nello specifico in che modo ogni applicazione utilizzava le risorse, oltre ai benchmark di prestazioni e configurazione di Hadoop.

Intel collabora con partner strategici per integrare questo software in diverse piattaforme e soluzioni di nuova generazione, e per favorirne la distribuzione in ambienti cloud pubblici e privati. Intel Distribution è disponibile negli Stati Uniti e in Cina ed è supportata da 1degreenorth*, AMAX*, Cisco*, Colfax Corporation*, Cray*, Datameer*, Dell*, En Pointe*, Flytxt*, Hadapt*, HStreaming*, Infosys*, LucidWorks*, MarkLogic*, NextBio*, Pentaho*, Persistent Systems*, RainStor*, Red Hat*, Revolution Analytics*, SAP*, SAS*, Savvis, a CenturyLink company, Silicon Mechanics*, SoftNet Solutions*, Super Micro Computer, Inc.*, Tableau Software*, Teradata*, T-Systems*, Wipro* and Zettaset*.

Un approccio completo ai big data
Il nuovo software amplia la vasta gamma di prodotti Intel per data center, networking, storage e sistemi intelligenti. Intelligent Systems Framework, una serie di sistemi interoperabili introdotti di recente e progettati per favorire la connettività, la gestione e la sicurezza tra dispositivi intelligenti in modo uniforme e scalabile, definisce le basi per consentire la raccolta, l'analisi e la distribuzione di informazioni preziose per l'analisi end-to-end, dal dispositivo al data center.

Intel continua inoltre a investire in ricerca e capitali per l’ulteriore sviluppo dell'ecosistema dei big data. Intel Labs svolge un ruolo di primo piano nella ricerca analitica avanzata, con lo sviluppo tra l'altro diIntel Graph Builder for Apache Hadoop* software, una libreria per comporre grandi set di dati in grafici in modo da visualizzarne le relazioni. Essoè ottimizzato per Intel Distribution for Apache Hadoop *per contribuire a ridurre i tempi di sviluppo eliminando la necessità di sviluppare grandi quantità di codice personalizzato. Nel frattempo, Intel Capital ha effettuato ingenti investimenti in tecnologie dirompenti per l'analisi dei big data, ad esempio nella società 10gen di MongoDB e nel fornitore di soluzioni per l'analisi di grandi volumi di dati Guavus Analytics.

[Immagine ad alta risoluzione]

To ensure that more organizations and people can use the vast amounts of data being generated, collected and stored everyday - also known as "big data" - Intel Corporation announced the availability of Intel Distribution for Apache Hadoop* software (Intel Distribution). The offering, which includes Intel Manager for Apache Hadoop* software, is built from the silicon up to deliver industry-leading performance and improved security features.

The ability to analyze and make sense of big data has profound potential to transform society by enabling new scientific discoveries, business models and consumer experiences. Yet, only a small fraction of the world is able to extract meaning from all of this information because the technologies, techniques and skills available today are either too rigid for the data types or too expensive to deploy.

Hadoop* is an open source framework for storing and processing large volumes of diverse data on a scalable cluster of servers that has emerged as the preferred platform for managing big data. With even more information coming from billions of sensors and intelligent systems also on the horizon, the framework must remain open and scalable as well as deliver on the demanding requirements of enterprise-grade performance, security and manageability.

"People and machines are producing valuable information that could enrich our lives in so many ways, from pinpoint accuracy in predicting severe weather to developing customized treatments for terminal diseases," said Boyd Davis, vice president and general manager of Intel's Datacenter Software Division. "Intel is committed to contributing its enhancements made to use all of the computing horsepower available to the open source community to provide the industry with a better foundation from which it can push the limits of innovation and realize the transformational opportunity of big data."

Performance and Security: The Intel Difference
Intel is delivering an innovative open platform built on Apache Hadoop* that can keep pace with the rapid evolution of big data analytics. The Intel Distribution is the first to provide complete encryption with support of Intel AES New Instructions (Intel AES-NI) in the Intel Xeon processor. By incorporating silicon-based encryption support of the Hadoop Distributed File System*, organizations can now more securely analyze their data sets without compromising performance.

The optimizations made for the networking and IO technologies in the Intel Xeon processor platform also enable new levels of analytic performance. Analyzing one terabyte of data, which would previously take more than 4 hours to fully process, can now be done in 7 minutes1 thanks to the data-crunching combination of Intel's hardware and the Intel Distribution. Considering Intel estimates that the world generates 1 petabyte (1,000 terabytes) of data every 11 seconds or the equivalent of 13 years of HD video, the power of Intel technology opens up the world to even greater possibilities.

For example, in a hospital setting, the intelligence derived from this data could help improve patient care by helping caregivers make quicker and more accurate diagnoses, determine effectiveness of drugs, drug interactions, dosage recommendations and potential side effects through the analysis of millions of electronic medical records, public health data and claims records. Strict guidelines also exist globally for protecting health and payment information, making it imperative to maintain security and privacy while performing analytics.

The addition of the Intel Manager for Apache Hadoop* software also simplifies the deployment, configuration and monitoring of the cluster for system administrators as they look to deploy new applications. Using the Intel Active Tuner for Apache Hadoop* software optimal performance is automatically configured to take the guesswork out of performance tuning. Until now, this required a specialized understanding of each application's use of system resources along with the Hadoop configuration and performance benchmarks.

Intel is working with strategic partners to integrate this software into a number of next-generation platforms and solutions, and to enable deployment in public and private cloud environments. Partners supporting the launch include 1degreenorth*, AMAX*, Cisco*, Colfax Corporation*, Cray*, Datameer*, Dell*, En Pointe*, Flytxt*, Hadapt*, HStreaming*, Infosys*, LucidWorks*, MarkLogic*, NextBio*, Pentaho*, Persistent Systems*, RainStor*, Red Hat*, Revolution Analytics*, SAP*, SAS*, Savvis, a CenturyLink company*, Silicon Mechanics*, Simba Technologies*, SoftNet Solutions*, SuperMicro Computer, Inc.*, Tableau Software*, Teradata*, T-Systems*, Wipro* and Zettaset*.

A Comprehensive Approach to Big Data
The new software offering expands Intel's extensive portfolio of datacenter computing, networking, storage and intelligent systems products. The recently introduced Intel Intelligent Systems Framework, a set of interoperable solutions designed to enable connectivity, manageability and security across intelligent devices in a consistent and scalable manner, sets the foundation to help to gather, analyze and deliver valuable information for end-to-end analytics from the device to the datacenter.

Additionally, Intel continues to invest in research and capital to advance the big data ecosystem. Intel Labs is at the forefront of advanced analytics research which includes the development of Intel Graph Builder for Apache Hadoop* software, a library to construct large data sets into graphs to help visualize relationships between data. Intel Graph Builder is optimized for the Intel Distribution to help reduce development time by eliminating the need to develop large amounts of custom code. Meanwhile, Intel Capital has been making major investments in disruptive big data analytics technologies including MongoDB company 10gen and big data analytics solution provider Guavus Analytics.

Source: Intel Press Release

tag: apache hadoop  |  big data  |  intel distribution


