Top 5 big data -projektia (avoimen lähdekoodin)
Näitähän riittää, top-listoja siis. Tässä yksi, jossa ainakin mielenkiintoisia vaihtoehtoja esiteltynä:Siliconangle kirjoitti tuosta myös. Kunniamaininnan sai mielenkiintoinen Googlen Spark, globaali...
View ArticleIntroducing Spark
MapReduce was developed mainly for batch-oriented jobs and it was optimized for throughput rather than latency. The inherent high latency in MapReduce makes it very unattractive for use cases where we...
View ArticleSo what makes Spark Lightning Fast?
Apache Spark claims that its a lightning-fast cluster [source]. It does make one wonder how come it is able to overcome the latency issues in MapReduce. In my previous blog I gave a brief introduction...
View ArticleA closer look at Spark
In our previous posts we gave a brief Introduction to Spark. Today we are going to have a more closer look at the Spark technology stack.Spark is 100% compatible with any Hadoop data storage system....
View ArticleDataStax and Databricks unite
Realizing the importance of in-memory processing for transaction processing of the Distributed DBMS Datastax has decided to partner with Databricks [1]. This partnership is also a strong indicator of...
View ArticleSpark Streaming - part 1
The importance of Real time big data analytics is becoming of enormous importance with every passing day. It enables us to take right decisions at the right time. Social networking sites like Twitter...
View ArticleSpark Streaming - part 2
In my previous post we discussed the challenges in the existing streaming systems and the motivation for Spark Streaming. As mentioned in my last post the biggest challenge was inefficient fault...
View ArticleDatabricks keräsi Sparkilla $33 miljoonaa
Kiinnostus ja usko Apachen Spark-projektiin ja muistinvaraisen analytiikan merkitykseen big datan seuraavana vaiheena sai jälleen sijoittajat liikkeelle. Yhdysvaltalainen Databricks ilmoitti...
View ArticleSpark Streaming - part 3
The most important feature of Spark Streaming is its robust fault recovery and efficient straggler handling. Today we will see how actually it is achieved in Spark Streaming. The robust fault recovery...
View ArticleSpark
Olemme kirjoittaneet tässä ja teknisessä blogissa paljon Apache-projekti Sparkista, jonka avulla muistinvaraisen analytiikan nopeuden saa helposti valjastettua käyttöönsä. Nyt kyseessä kuitenkin toinen...
View ArticleHadoop yhä vaan nopeampi
Hadoopin kehitys on ollut huimaa ja ennusteet vielä huimempia. Markkinoiden koon ennakoidaan kasvavan nopeasti, jopa 25-kertaisiksi vuoteen 2020 mennessä ja on yhä vaikeampi löytää big data...
View ArticleNopeuskilpailua datalla
Apache Spark teki maailmaennätyksenDatarbricks rikkoi Yahoon Hadoopilla tekemän maailmanennätyksen 100 teratavun datamassan järjestelyssä. Aikaisempi ennätys oli 2 100 koneen Hadoop-klusterilla...
View Article
More Pages to Explore .....