Giuditta Mosca, 23 giu 2019
In informatica e nelle sue derivazioni nulla è trascendentale. Qualsiasi argomento, anche ostico, è perfettamente comprensibile e assimilabile. Occorre un metodo di studio, certo, così come occorre partire da risorse attendibili e adeguate al proprio livello di conoscenza.
Cominciamo quindi con risorse dedicate ai novizi, gratuite e (per fortuna) in lingua inglese.
Un mondo variegatissimo
Multidisciplinarità e trasversalità sono più che parole d’ordine, sono l’antefatto embrionale all’acquisizione delle conoscenze. Chi è interessato ai Big data deve per forza fare suoi concetti di programmazione, di data mining e visualizzazione delle informazioni, così chi è interessato all’intelligenza artificiale non può prescindere dal machine learning e dal deep learning.
Considerata l’ampiezza degli argomenti da trattare può essere utile scegliere percorsi di studio e apprendimento circoscritti e definiti, in un’offerta di risorse e piattaforme che sembra davvero sconfinata.
Qui suggeriamo da dove iniziare. Piattaforme, manuali, ambienti e linguaggi di programmazione citati in questo articolo sono solo una parte delle risorse a disposizione, questa vuole essere una sorta di guida per acquisire conoscenze fondamentali.
Big data e analisi dei dati
Raccogliere e archiviare i dati è un compito relativamente semplice. Cosa farne è tema più complesso. Distinguo necessario, in questo caso almeno, per tenere ben definiti il comparto dei Big data e quello della data analysis, collimanti certo ma non per forza di cose sovrapposti.
Chi volesse avvicinarsi al mondo dei Big data può cominciare dai corsi gratuiti organizzati da Cognitive Class, concepiti per i principianti e suddivisi in 3 moduli della durata totale di 12 ore.
In seguito, per approfondire la materia, Dataquest permette di lavorare in modo guidato e gratuito con la programmazione, sfruttando dati preselezionati e dando vita a un esercizio completo con il quale misurarsi.
Per approfondire le necessarie competenze in programmazione, qui c’è una discreta quantità di manuali di Python (anche in lingua italiana), mentre qui c’è un libro essenziale per chi volesse approfondire il linguaggio R. Entrambi questi linguaggi di programmazione sono prelevabili gratuitamente (qui si può prelevare Python, mentre qui si può prelevare R).
Python soprattutto è essenziale per l’analisi dei dati. Due estensioni di questo linguaggio di programmazione (nel caso specifico NumPy e Pandas) sono utili per l’analisi dei dati. Udacity offre un corso immersivo e gratuito che ne sfrutta le capacità di calcolo e di analisi.
Database e framework
I database sono necessari per l’archiviazione delle informazioni in modo logico e ordinato. Anche in questo caso l’offerta è ampia, citiamo MySQL (gratuito) Microsoft SQL express, a costo zero fino a 10 GB di dati. I principianti di MySQL possono avvalersi di corsi gratuiti e di una vasta documentazione online, di un nutrito e completo forum e di documentazione supplementare per neofiti. Chi volesse avventurarsi con il database relazionale di Microsoft può indirizzarsi verso corsi online gratuiti concepiti per non necessitare requisiti tecnici e conoscenze particolari, partendo magari da un corso di teoria generale. Un ottimo manuale è invece prelevabile qui.
Data mining
L’analisi dei dati e il data mining sono due cose diverse. Mentre la prima si prefigge, tra i propri scopi, la pulizia, la trasformazione, la modellazione e la visualizzazione dei dati al fine di rivelare informazioni utili, il data mining è un’estrapolazione di dati secondo ottiche diverse, per esempio per trovare risposte a domande specifiche e individuare modelli e relazioni tra le informazioni.
Le tecniche di data mining sono per lo più automatizzate e fanno leva su alberi decisionali e reti neurali.
Per entrare in sintonia con questo argomento esistono diverse piattaforme. Tra queste, tenendo soprattutto fede al principio della gratuità, va segnalata Knime (Konstanz Information Miner), risorsa Open source che offre anche un’adeguata documentazione e dei corsi online che però hanno un costo che varia dai 50 euro ai 250 euro.
Le attività di Data mining si appoggiano a costrutti di machine learning, altra materia che può legittimamente affascinare e alla quale ci si può avvicinare per gradi.
Machine learning
La piattaforma Knime, già citata nel paragrafo precedente, offre componenti di machine learning. Tuttavia, considerando la complessità del tema, occorre approfondirne i principi teorici. La letteratura è vasta, il suggerimento è di cominciare da questo documento, un must read per chi vuole accostarsi al machine learning e una lettura essenziale anche per prendere parte al corso online gratuito offerto da Class Central e Udacity. Altre letture gratuite raccomandate sono Bayesian Reasoning and Machine Learning del professore David Barber (il libro viene aggiornato periodicamente) e, per approfondire il connubio tra Python e Machine learning, dopo avere appreso i documenti citati sopra, vale la pena affidarsi ad almeno uno di questi 5 libri gratuiti.
Intelligenza artificiale
È un costrutto che si erige su altre discipline, tra le quali il machine learning e il deep learning. Ancora prima è un pensiero filosofico e, compiendo un piccolo atto di coraggio, si può affermare che affonda le proprie radici in tempi remoti, nonostante se ne parli con diversa enfasi ufficialmente dagli anni Cinquanta del secolo scorso.
Circa nel 400 a. C. Platone, riferendosi a Socrate, ne descrive la volontà di riuscire a scindere la pietà dalla non pietà. Un algoritmo rudimentale che ha il merito di dimostrare bene sia la curiosità intrinseca dell’uomo che oggi si manifesta anche nell’Intelligenza artificiale, sia la natura filosofica dei quesiti le cui soluzioni ancora oggi vogliono essere demandate alle macchine.
Per orientarsi in questo universo che appare essere difficilmente definibile, consigliamo di leggere il libro gratuito Artificial Intelligence: foundations of computational agents e soltanto dopo fare un’immersione nel tomo dedicato alle logiche computazionali e a come l’uomo si appoggia alla natura per imbastire studi e considerazioni in materia di Intelligenza artificiale. Gli aspetti filosofici sono invece egregiamente riassunti e concentrati in questo documento gratuito.
I novizi dovrebbero partire da questo corso online, la cui durata è di 16 settimane e prevede un impegno di 6 ore a settimana, per poi proseguire con la formazione offerta da quest’altro corso online (adatto fin da subito alle persone con competenze avanzate), un viaggio approfondito nell’Intelligenza artificiale con particolare focus sulla guida autonoma e che prevede un impegno di circa 10 ore a settimana per 12 settimane. Google mette a disposizione una piattaforma pensata per soddisfare le necessità dei neofiti e quelle di chi nutre appetiti più mirati e ha già acquisito conoscenze solide.
Visualizzazione dei dati
Dopo avere raccolto, pulito ed elaborato i dati, dopo avere applicato logiche di machine learning o di deep learning e intelligenza artificiale per ottenere dei risultati, questi vanno normalmente mostrati a una platea specifica. Ci sono strumenti gratuiti anche per assolvere questo compito.
Chi ha familiarità con Microsoft Excel può provare Power BI, strumento di visualizzazione e business intelligence di Microsoft.
Uno dei migliori software è Tableau Public (l’unica versione gratuita tra quelle offerte), ampiamente documentata e supportata da una numerosa community di utenti e appassionati.
Nessun commento:
Posta un commento