3


 scrivi un post

avatar

Come ricavare / scoprire l'encoding di un file (di testo txt, csv, etc.)

By  testuser01 | Martedì, 31/07/2018 20:30

La codifica dei file (encoding) dei file di testo e dei .csv spesso crea problemi. Ad esempio con pandas di python se ci sono caratteri "strani" e non si fornisce il giusto encoding mentre il crea il dataframe dal csv appaiono errori del tipo:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb0 in position 26: invalid start byte

Per scoprire quale codifica ha il file che stai usando puoi con linux usare il comando "file -i *". Apri il terminale nella posizione in cui si trovano i file e poi digita:

file -i *

il terminale vi mostrerà   la lista dei file. Per i file .csv vi verrà   mostrato l'encoding (i più comuni sono utf-8 e iso-8859-1).

preview #1

Pagina riservata agli utenti registrati e loggati.
Solo gli utenti iscritti e loggati possono inserire un nuovo post.

Per iscriverti: registrazione

Per fare l'accesso: login

 

avatar

Consigli per visualizzare "bene" le informazioni estratte dai dati (uno su tutti: semplicità)

By  Fabio | Domenica, 22/07/2018 13:50

Condivido con voi questo "vademecum visuale" di preziosi consigli su come visualizzare & mostrare le informazioni (dataviz) mediante grafici e diagrammi (non so se le due parole sono perfetti sinomini oppure se hanno diversi significati): www.geckoboard.com/learn/data-literacy/d..

In allegato al post la infografica che riassume i "tips & tricks".

In ordine sparso e casuale ecco alcuni punti che ho colto leggendo la pagina:

1) rimani semplice, fai della semplicità   il "main focus": spesso ci si fa prendere la mano e si fanno grafici belli da vedere ma difficili da capire. No, falli semplici da capire e dopo belli da vedere.

2) le tabelle permettono agli utenti di fare confronti: rendi la vita facile al tuo utente, allinea i numeri a destra facendoli partire tutti dallo stesso ordine di grandezza (per esempio fa che il primi numero sia l'unità  , i devimali ponili a destra)

3) mettere due dataset diversi nello stesso grafico consente di "raccontare molto bene le informazioni": ricordati di usare due scale diverse e di porre gli assi uno a destra ed uno a sinistra;

4) se non necessario: non usareil 3D, piace solo agli sviluppatori... ma rende difficile la comprensione per l'utente;

5) mantieni semplice il grafico: già   detto ma vale la pena ripeterlo. Non cadere nella trappola dei troppi colori, troppe label, troppi bordi. Stai semplice e il tuo utente ringrazierà  ;

6) usa i colori per comunicare informazione e non per decorare inutilmente: stai semplice :-)

7) less is more: devi comunicare un concetto, non partecipi ad un concorso di belle arti;

8) per confronti usa lunghezze al posto di volumi ed aree;

9) se possibile evita i grafici a torta;

10) per i grafici a linee mostra, se poissibile, tutta la scala delle ordinate;

11) i grafici a barre sono ottimi per i confronti ma falli partire da zero;

Consigli semplici che tuttavia sono quasi mai presi in considerazioni dal dataScientist... è facile farsi prendere la mano dall'estetica.

preview #1

Pagina riservata agli utenti registrati e loggati.
Solo gli utenti iscritti e loggati possono inserire un nuovo post.

Per iscriverti: registrazione

Per fare l'accesso: login

 

avatar

9 "bignami" per algoritmi Machine Learning in Python ed R

By  Fàbio 2 | Venerdì, 20/07/2018 8:00

Condivido questo comodo e sintetico cheatsheet che mostra le basi python ed r per gli algoritmi base del Machine Learning. Spero l'immagine si veda bene, altrimenti il pdf originale si può scaricare da qui: www.analyticsvidhya.com/wp-content/uploa..

Gli algoritmi machineLearning trattati sono:

Supervised Learning: Decision Tree, Random Forest, kNN , Logistic Regression

Unsupervised Learning: Apriori algorithm, k-means, Hierarchical Clustering

Reinforcement Learning: Markov Decision Process, Q Learning

Per la parte python sono moduli sklearn (sci-kit learn)

preview #1

Pagina riservata agli utenti registrati e loggati.
Solo gli utenti iscritti e loggati possono inserire un nuovo post.

Per iscriverti: registrazione

Per fare l'accesso: login

 

avatar

DSaaS: Data-Scientist as a Service

By  OSP | Mercoledì, 11/07/2018 11:15

Soprattutto per il tessuto economico italiano fatto di tantissime micro e piccole imprese avere "un intero" data scientist in azienda è sia oneroso economicamente parlando che, non voglio usare la parola inutile o sprecato, ma "di troppo". Per una piccola azienda spesso è sufficiente il lavoro di qualche mese o semestre per attivare una razionalizzazione dei processi di analisi dei dati sufficienti a impattare sul modello di business.

Ecco che un "Data-Scientist as a Service" sarebbe molto comodo! Un professionista che ha competenze SIA di analisi e gestione dei dati SIA che una buona propensione a comprendere in modo veloce e sveglio il business potrebbe proporsi appunto come "servizio". Ci sono molte sovrapposizione con i tradizionali servizi di consulenza manageriale e di business, questo DSaaS sarebbe più orientato al servizio di data-analytics (in prima battuta) e di instaurare nell'azienda semplici processi "digital oriented".

Soprattutto nel campo dell'analisi dei dati generati dal settore IoT questa necessità   sta emergendo con vigore: www.ioti.com/analytics/iot-data-analytic..

in questo campo (IoT) che non tocca direttamente le scelte manageriali e di business il dataScientist as a Service potrebbe trovare terreno molto fertile.

preview #1

Pagina riservata agli utenti registrati e loggati.
Solo gli utenti iscritti e loggati possono inserire un nuovo post.

Per iscriverti: registrazione

Per fare l'accesso: login

 

avatar

Libro "Machine Learning for beginners", scaricato a 0€

By  Fabio | Sabato, 07/07/2018 17:35

Non so come funzionano gli algoritmi di Amazon Kindle, fatto sta sono riuscito ad avere un bellissimo volume dedicato al machine learning a prezzo 0€ ovvero gratuitamente.

Si tratta di un libro di "John Slavio, Machine Learning for beginners - An introduction to Artificial Intelligence and Machine Learning", lo trovate qui: www.amazon.com/Machine-Learning-Beginner..

Con un linguaggio semplice e diretto John dapprima fornisce una introduzione a cosa è il machineLearning, poi racconta quali sono le applicazioni dimostrandone il loro impatto sull'economia e sulla società  . Infine descrive i classici algoritmi dell'artificialIntelligence: supervisionati, non-supervisionati e così via.

Se lo trovi gratuitamente come è capitato per me prendilo subito altrimenti al momento è prezzato 4.93$. Per me è stata una buona lettura estiva :-) anche se non sono sicuri siano libri da spiaggia...

preview #1

Pagina riservata agli utenti registrati e loggati.
Solo gli utenti iscritti e loggati possono inserire un nuovo post.

Per iscriverti: registrazione

Per fare l'accesso: login

 

avatar

Da zero a Data scientist in 3 mesi (con i consigli di Siraj Raval)

By  Fabio | Lunedì, 02/07/2018 18:41

Seguo Siraj da molto tempo, fin dai primi video quelli in cui parlava di python e di artificial intelligence con umorismo ironia e spesso anche "music-video". Siraj ora ce l'ha fatta ed è diventato un "influencer" del settore data science.

Recentemente ha pubblicato un video in cui dà   un programma per ambire a diventare dataScientist in 3 mesi. Il video è molto interessante ma ancora più precisi e concreti sono i link ai corsi inseriti sotto al video.

Quando avete 10 minuti di tempo e vi interessa il mondo delmachineLearning date un'occhiata a: www.youtube.com/watch?v=Cr6VqTRO1v0 (Learn Machine Learning in 3 Months)

preview #1

Pagina riservata agli utenti registrati e loggati.
Solo gli utenti iscritti e loggati possono inserire un nuovo post.

Per iscriverti: registrazione

Per fare l'accesso: login

 

avatar

Esplorare un dataset con Pandas di Python, infografica

By  Fàbio 2 | Lunedì, 18/06/2018 23:04

Esplora i tuoi dati con pandas in python. In questa bellissima infografica sono riassunti i comandi pene iniziare ad analizzare ed a osservare un nuovo dataset. Molto interessanti le funzioni di aggregazione. Trovate la infografica in allegato al messaggio. Ciao.

preview #1

Pagina riservata agli utenti registrati e loggati.
Solo gli utenti iscritti e loggati possono inserire un nuovo post.

Per iscriverti: registrazione

Per fare l'accesso: login

 

avatar

Conferenza a Zug: CRYPTO WORLD ZUG CONFERENCE - 12 e 13 giugno 2018

By  Fàbio 2 | Martedì, 12/06/2018 8:04

Parte oggi 12 giugno 2018 nella crypto valley a Zug in Svizzera la conferenza CRYPTO WORLD ZUG CONFERENCE.

Exchanges, Private Keys, Proof of Work, Altcoins, Wallets, … ? Are you new to the world of Crypto & Blockchain and trying to make sense of this new technology? Join us in Zug, Switzerland in June 2018 and become a part of the Blockchain revolution!

Grasp the basic concepts underpinning Blockchain & Crypto, in plain English and with an emphasis on real-life aspects: use-cases, regulations, opportunities and much more.

No matter if you are a technology enthusiast, a business owner, consultant, lawyer, freelancer or a startup. Our expert-speakers will help you to understand the next digital revolution.

Maggiori informazioni: cryptoworldzug.io/

preview #1

Pagina riservata agli utenti registrati e loggati.
Solo gli utenti iscritti e loggati possono inserire un nuovo post.

Per iscriverti: registrazione

Per fare l'accesso: login

 

avatar

25 termini del mondo bigdata

By  Fabio | Domenica, 03/06/2018 22:53

Segnalo questo bell’articolo che presenta 25 dei termini più comuni che si incontrano nelle discussioni su bigdata e machineLearning: www.datasciencecentral.com/profiles/blog..

Buona lettura

preview #1

Pagina riservata agli utenti registrati e loggati.
Solo gli utenti iscritti e loggati possono inserire un nuovo post.

Per iscriverti: registrazione

Per fare l'accesso: login

 

avatar

Licenze Microsoft office a pochi euro? Su amazon le "digital" per il 2016 professional si trovano a meno di 6 euro

By  Fàbio 2 | Sabato, 02/06/2018 12:35

Fate una ricerca su amazon con le keyword "office digital licence" navigate tra i risultati e troverete offerte che per meno di 10€ vi assicurano il pacchetto software office 2016 professional completo (Microsoft Office 2016 Professional Plus - Digital Download - Licence Only).

Ho cercato in rete per capire se la cosa fosse legale e non ho trovato nulla in merito: deduco che queste licenze molto scontate siano legali. Mia opinione: per il pc di casa vale la pena di tentare, al massimo si sono buttati 5-10€ mentre in caso di aziende è meglio informarsi per bene sulla validità   e liceità   di tali licenze.

Per il pc di casa ho fatto una prova acquistando da SAM Soft che suppongo sia una azienda con sede in UK. Ordine a meno di 6€ fatto la sera, al mattino avevo già   l'email con il "product key". Collegato al sito di Microsoft, ho creato come scritto nelle istruzioni un nuovo account et voilat, tutto è funzionato alla perfezione.

preview #1

avatar
By Fabio | Domenica, 2018-06-03 18:48:19

 Attenzione!

Sono legali solo se usate dalle persone, istituzioni, associazioni, etc per le quali sono state emesse. Se la licenza digital è stata generata per una classe di studenti non è legale utilizzarla in un pc aziendale o privato.

Fate molta attenzione.

Pagina riservata agli utenti registrati e loggati.
Solo gli utenti iscritti e loggati possono inserire un nuovo post.

Per iscriverti: registrazione

Per fare l'accesso: login

 

 scrivi un post

Numero di pagine: 15