13 firem na Big Data, které máme sledovat v roce 2013

big data10gen – mongoDB

10gen vyvíjí a komerčně podporuje opensourcovou MongoDB.

Amazon (AWS) – Elastic MapReduce, DynamoDB, Redshift

Elastic MapReduce je více než 3 roky stará a založená na Hadoopu.

Amazon DynamoDB je NoSQL databázová služba a Redshift je škálovatelná služba na datové sklady s plánovaným uvolněním začátkem příštího roku (nyní v preview).

Cloudera – jednička v poskytování Hadoopu, školení a komerní podpoře

Cloudera ma rychlý SQL engin s názvem Impala ve fázi beta, který má bý mnohem rychlejší a bez závislosti na zpracování MapReduce.

CouchBase

CouchBase vyvíjí a komerčně podporuje open-source stejnojmennou open-source databázi. CouchBase sází na škálovatelnost a výkon.

Datameer – má náskok v analytice

Datameer poskytuje prostředí na analýzu s rozhraním ve stylu tabulek a poskytuje přes 200 analytických funkcí. Pracuje s Hadoopem a nedávno uzavřel partnerství s Workday.

Datastax – Cassandra na 3 způsoby

Datastax, který mimo jiné poskytuje komerční podporu Cassandry implementuje Cassandru buď jako samostatnou databázi, nebo ve spojení s Hadoopem, nebo ve spojení s Solrem.

Hadapt – relační analytika na Hadoopu

Hadapt přídává vrstu, která poskytuje relační přístup k datům a snižuje tak zpoždění způsobovaná MapReduce.

Hadapt poskytuje rychlost relačních nástrojů spolu se škálovatelností Hadoopu.

Hortonworks – konzervativně na Hadoop

Hortonwoks také podporuje komerčně Hadoop a jedná se o spinoff Yahoo z roku 2011.

Hortonworks poskytuje distribuce čistě jako open-source a říká, že platforma je odzkoušena a enterprise-ready. Hortonworks také vytvářel verzi Hadoop pro Microsoft, která běží na Windows.

Karmasphere – integruje s Impalou

Karmaspere poskytuje platformu na reporting, analýzu a vizualizaci dat pro Hadoop. Tento software je také dostupný jako služba na AWS.

MapR – praktičnost a výkon

MapR tvrdí, že dosahuje dvojnásobku rychlosti s polovinou hardware.

MapR používá NFS místo HDFS kvůli nedostatkům ve spolehlivosti a dostupnosti.

MapR je dostupná na AWS i na Google Compute Engine.

Neo Technologies – Neo4j

Neo4j je open-source grafová databáze pro všeobecné použití, která zvládátransakční zpracování či analytiku. Vhodná pro modelování a dotazování na vysoce složitých a propojených sítích.

Platfora – Hadoop pod lupou

Platfora je nejnovější ze společností na analýzu v big datech.

Platfora umožňuje uživatelům vytváře a zkoumat intuitivní a interaktivní vizualizace dat. Datové lupy běží v paměti a odezva na dotazy má tak být velmi rychlá. Dokonce i změna či přidání datových typů či dimenzí má být záležitostí minut či hodin.

Splunk – machine data

U Splunku si všimli, že jejich technologie by mohla zodpovědět všechny druhy otázek týkajících se high-scal machine dat, což jim pomohlo v letošním úspěšném IPO.

Power useři mohou nestavit metriky a dashboardy, které využijí business useři, aby lépe porozuměli trafficu z e-commerce, vyhledávacích výsledků, efektivitě reklamních kampaní a dalším faktorům ve vztahu k machine datům.

Zdroj: Informationweek

Nová funkčnost Google vyhledávání – datasets
google dataset search úvodní stránka

Datasets je poháněná vyhledávacím strojem Dataset Search, speciálně navrženým pro datasety. Shromažďuje informace z různých oblastí včetně vědeckých, vládních a Celý článek