Quantcast
Channel: Big data - Spark
Browsing latest articles
Browse All 12 View Live

Top 5 big data -projektia (avoimen lähdekoodin)

Näitähän riittää, top-listoja siis. Tässä yksi, jossa ainakin mielenkiintoisia vaihtoehtoja esiteltynä:Siliconangle kirjoitti tuosta myös. Kunniamaininnan sai mielenkiintoinen Googlen Spark, globaali...

View Article



Image may be NSFW.
Clik here to view.

Introducing Spark

MapReduce was developed mainly for batch-oriented jobs and it was optimized for throughput rather than latency. The inherent high latency in MapReduce makes it very unattractive for use cases where we...

View Article

So what makes Spark Lightning Fast?

Apache Spark claims that its a lightning-fast cluster [source]. It does make one wonder how come it is able to overcome the latency issues in MapReduce. In my previous blog I gave a brief introduction...

View Article

Image may be NSFW.
Clik here to view.

A closer look at Spark

In our previous posts we gave a brief Introduction to Spark. Today we are going to have a more closer look at the Spark technology stack.Spark is 100% compatible with any Hadoop data storage system....

View Article

Image may be NSFW.
Clik here to view.

DataStax and Databricks unite

Realizing the importance of in-memory processing for transaction processing of the Distributed DBMS Datastax has decided to partner with Databricks [1]. This partnership is also a strong indicator of...

View Article


Image may be NSFW.
Clik here to view.

Spark Streaming - part 1

The importance of Real time big data analytics is becoming of enormous importance with every passing day. It enables us to take right decisions at the right time. Social networking sites like Twitter...

View Article

Image may be NSFW.
Clik here to view.

Spark Streaming - part 2

In my previous post we discussed the challenges in the existing streaming systems and the motivation for Spark Streaming. As mentioned in my last post the biggest challenge was inefficient fault...

View Article

Databricks keräsi Sparkilla $33 miljoonaa

Kiinnostus ja usko Apachen Spark-projektiin ja muistinvaraisen analytiikan merkitykseen big datan seuraavana vaiheena sai jälleen sijoittajat liikkeelle. Yhdysvaltalainen Databricks ilmoitti...

View Article


Image may be NSFW.
Clik here to view.

Spark Streaming - part 3

The most important feature of Spark Streaming is its robust fault recovery and efficient straggler handling. Today we will see how actually it is achieved in Spark Streaming. The robust fault recovery...

View Article


Spark

Olemme kirjoittaneet tässä ja teknisessä blogissa paljon Apache-projekti Sparkista, jonka avulla muistinvaraisen analytiikan nopeuden saa helposti valjastettua käyttöönsä. Nyt kyseessä kuitenkin toinen...

View Article

Hadoop yhä vaan nopeampi

Hadoopin kehitys on ollut huimaa ja ennusteet vielä huimempia. Markkinoiden koon ennakoidaan kasvavan nopeasti, jopa 25-kertaisiksi vuoteen 2020 mennessä ja on yhä vaikeampi löytää big data...

View Article

Nopeuskilpailua datalla

Apache Spark teki maailmaennätyksenDatarbricks rikkoi Yahoon Hadoopilla tekemän maailmanennätyksen 100 teratavun datamassan järjestelyssä. Aikaisempi ennätys oli 2 100 koneen Hadoop-klusterilla...

View Article
Browsing latest articles
Browse All 12 View Live




Latest Images

Vimeo 10.7.0 by Vimeo.com, Inc.

Vimeo 10.7.0 by Vimeo.com, Inc.

HANGAD

HANGAD

MAKAKAALAM

MAKAKAALAM

Doodle Jump 3.11.30 by Lima Sky LLC

Doodle Jump 3.11.30 by Lima Sky LLC

Doodle Jump 3.11.30 by Lima Sky LLC

Doodle Jump 3.11.30 by Lima Sky LLC

Vimeo 10.6.1 by Vimeo.com, Inc.

Vimeo 10.6.1 by Vimeo.com, Inc.