Caricamento

TECNOLOGIE E SOFTWARE DI DATA SCIENCE

BIG DATA, NUOVE COMPETENZE PER NUOVE PROFESSIONI
Non ci sono sessioni attive al momento

date_range CORSO FINANZIATO

 

Operazione Rif. Pa 2018-94957RER approvata con DGR n° 633 del 2 maggio 2018 e Operazione Rif. PA 2019-11596/RER approvata con DGR n° 789 del 20 maggio 2019 co-finanziate dal Fondo Sociale Europeo PO 2014-2020 Regione Emilia-Romagna

 


Il progetto, gestito in partnership da una compagine di enti di formazione tra cui Fondazione Aldini Valeriani, si rivolge a laureati (da non più di 24 mesi) in ogni area disciplinare (umanistica, economico sociale, scientifica) residenti o domiciliati in regione Emilia Romagna da data antecedente l’iscrizione ai percorsi formativi.

 

 

Programma

Il corso riguarda i seguenti contenuti 

  • Overview della definizione di soluzioni architetturale per il trattamento di Big Data Hadoop common (strato software comune con funzioni di supporto) 
  • Hadoop Distributed File System (HDFS – derivato da Google’s GFS) 
  • Hadoop tools, ecosistema e distribuzioni 
  • Comprendere MapReduce 
  • Utilizzo di tecnologie open source per trasferire i dati processati da HDFS in un database SQL e viceversa (ETL) 
  • Differenze tra SQL e linguaggi usati per i BIG DATA 
  • Operazioni CRUD e aggregazioni avanzate 
  • Elaborazione dati ed esportazione verso NOSQL 
  • Utilizzo di MongoDB Connector for Hadoop 
  • L’importanza di saper comunicare i dati: strumenti di “Data Visualization” 
  • Algoritmi di data mining (per operazioni di classificazione, regressione, clusterizzazione) 
  • Algoritmi per la market basket analysis 
  • Algoritmi per trovare item simili in larghe quantità di dati 
  • Librerie Python per la gestione e la visualizzazione dei dati (ad es. Pandas, Scikit-Learn, Matplotlib, Seaborne) 
  • Apache Spark per l’analisi dei dati: RDD, Structured queries, e use case di esempio)
Partecipanti

12

Durata

120 ore

Sede

Fondazione Aldini Valeriani
via Bassanelli 9/11, Bologna

Per saperne di più




Obiettivi

Al termine del progetto i partecipanti saranno in grado di: 

Il percorso è verticale rispetto al principale framework dei Big Data: Apache Hadoop, che supporta applicazioni distribuite con elevato accesso ai dati sotto una licenza libera, in particolare consente di elaborare in modo efficiente grandi set di dati. La gestione dei dati può comportare query su dati strutturati all’interno di database di grandi dimensioni, oppure ricerche su file system distribuiti od infine operazioni di manipolazione, visualizzazione, trasferimento e cancellazione di file e directory distribuite su più server. Apache Hadoop consente l’elaborazione distribuita di grandi insiemi di dati attraverso cluster di servers, oppure sui servizi di cloud computing. È stato progettato per scalare da singolo server a migliaia di macchine distribuite, ognuna delle quali offre capacità di calcolo e di immagazzinamento. Per la gestione dei Big Data offre alcune componenti molto utilizzate: HDFS e MAP Reduce. Apache Hadoop è un ambiente che supporta applicazioni distribuite con elevato accesso ai dati sotto una licenza libera; permette alle applicazioni di lavorare con migliaia di nodi e petabyte di dati. Hadoop è stato ispirato dalla MapReduce di Google e dal Google File System. Un grande numero di librerie software utilizzano il framework Hadoop per gestire e analizzare i dati. Nella fattispecie, trovano una larga diffusione in questo momento, in caso di dataset di estensione limitata librerie Python per la gestione e la predizione dei dati quali ad esempio Pandas e Scikit Learn e, in caso di dati con maggiore estensione, applicazioni costruite con il framework Apache Sp 

Target

Neo-Laureati (da non più di 24 mesi) in ogni area disciplinare (umanistica, economico sociale, scientifica) residenti o domiciliati in regione Emilia Romagna da data antecedente l’iscrizione ai percorsi formativi

 

.

In breve
gps_not_fixed
Area Tematica
Innovazione
Segreteria
didattica
person
Alessandra Fraticelli
phone
0514151985
mail
Scrivici

Allegati

Scarica
Brochure completa Edizione 1
Scarica
Brochure completa Edizione 2

Ti potrebbe interessare anche

DATA LAB
GUARDA AVANTI – BIG DATA, NUOVE COMPETENZE PER NUOVE PROFESSIONI
Promozioni
Corso finanziato.
Scopri di più
IOT & BIGDATA ANALYTICS
BIG DATA, NUOVE COMPETENZE PER NUOVE PROFESSIONI
Promozioni
Corso finanziato.
Scopri di più
STRUMENTI DI DATA ANALYSIS E VISUALIZATION
BIG DATA, NUOVE COMPETENZE PER NUOVE PROFESSIONI
Promozioni
Corso finanziato.
Scopri di più