Hive Grunnkurs

Apache Hive er blitt en de facto standard for distribuerte datavarehus – opprinnelig utviklet av Facebook for å kunne bruke et SQL-liknende språk i MapReduce-operasjoner med spørringer i store, distribuerte datasett. Hive brukes nå av en rekke kjente firmaer, fra Facebook, CNET og Scribd til Netflix og Last.fm. Read more

Cassandra Grunnkurs

Cassandra er en stadig mer populær NoSQL database som bl.a. har automatisk replikering til multiple noder, gjerne over flere datasentre. Noder som feiler kan erstattes uten nedetid, noe som gjør databasen ideell for situasjoner som krever høy tilgjengelighet. Cassandra brukes bl.a. av CERN, Facebook, eBay, GitHub, Instagram, Netflix, Spotify og Finn.no. Read more

HBase Grunnkurs

ITFakultetet til byr et grunnkurs i HBase:

Bakgrunn
H’en  i HBase står for Hadoop, og HBase er databasen med tettest integrering mot hele Hadoops økosystem. HBase brukes av noen av de største aktørene på web – f.eks. lagrer Facebook alle «Likes» i HBase – og databasen er spesialisert på rask lagring og henting av individuelle data til og fra store, distribuerte tabeller i sanntid. StumbleUpon driver f.eks. store deler av sin nettportal live fra HBase. Read more