Quina diferència hi ha entre Hadoop Big Data, Cassandra, MongoDB, CouchDB? Vull aprendre un d’aquests mitjançant la formació en línia. Quina és la millor plataforma per aprendre? http://www.wiziq.com/course/21308-hadoop-big-data-training


Resposta 1:

Aquesta és en realitat una de les meves principals preguntes sobre aquestes eines, però faré el possible per respondre-ho a partir de les coses que he trobat ja:

1. Totes aquestes eines us permeten emmagatzemar i fer una mica d’analítica sobre les dades.

2. No tots els productes NoSQL s’han provat tant com Hadoop. Així, quan es tracta de conjunts de dades realment molt grans, i en l'anàlisi sobre ells, principalment tens Hadoop.

3. Les coses NoSQL són molt bones per a la recuperació de documents, com la quantitat de correus electrònics molt gran. És inútil utilitzar HDFS i utilitzar Hadoop per recuperar-lo.

4. Si voleu fer algunes tasques d’anàlisi pesades a les vostres dades i no teniu ni idea de quin tipus de coses es necessitaran (gràfic, iteratiu o lot), haureu d’anar a la direcció Hadoop / HDFS. Sempre podeu utilitzar-lo com a backend per als productes NoSQL.

5. No tinc idea de fer algunes analítiques sobre les dades si és millor utilitzar Solr / ElasticSearch, NoSQL o Hadoop / Spark. O per a quins tipus de consultes és millor?

Intentaré actualitzar això més endavant. Però esperem que això ajudi.


Resposta 2:

HDPOD és una plataforma completa Hadoop Big Data, dissenyada per a un tractament de dades fiable amb un cost total total de propietat. El HDPOD combina maquinari de xarxa, servidor i emmagatzematge i la suite de programes completa de programes Hortonworks Data Platform (HDP) en una configuració clau en mà optimitzada. D’aquesta manera es crea una solució única SKU completa amb serveis integrats de maquinari, programari i suport, senzills d’aconseguir i implementar.