Big Data

Big Data

数据库顶级会议——ACM VLDB（PVLDB）会议介绍

VLDB和另外两大数据库会议SIGMOD、ICDE构成了数据库领域的三个顶级会议。VLDB (Very Large Data Base) 是数据库研究人员，供应商，参与者，应用开发…

江海志
2016-02-08
Big Data

RDD：基于内存的集群计算容错抽象（Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing）

该论文来自Berkeley实验室，英文标题为：Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In…

江海志
2016-01-15
Big Data

Ubuntu下使用Spark Streaming处理来自FlumeNG的流数据基本方法

SparkStreaming是一个对实时数据流进行高通量、容错处理的流式处理系统，可以对多种数据源（如Kdfka、Flume、Twitter、Zero和TCP 套接字）进行类似ma…

江海志
2015-11-17
Big Data

Linux下基于Hadoop的Spark1.2单机安装

一，安装环境硬件：虚拟机操作系统：Centos 6.4 64位 IP：10.51.121.10 主机名：datanode-4 安装用户：root Hadoop：Hadoop2.…

江海志
2015-11-15
Big Data

Ubuntu下基于hadoop安装Spark开发环境

Ubuntu 64基本环境配置安装JDK，下载jdk-8u45-linux-x64.tar.gz，解压到/opt/jdk1.8.0_45 下载地址：http…

江海志
2015-11-15
Big Data

Hadoop2.6在Linux下单机安装教程

一，安装环境硬件：虚拟机操作系统：Centos 6.4 64位 IP：10.51.121.10 主机名：datanode-4 安装用户：root 二，安装JDK 安装JDK1.…

江海志
2015-11-10
Big Data

《Hadoop基础教程》之初识Hadoop

Hadoop一直是我想学习的技术，正巧最近项目组要做电子商城，我就开始研究Hadoop，虽然最后鉴定Hadoop不适用我们的项目，但是我会继续研究下去，技多不压身。《Hadoop…

江海志
2015-09-25
Big Data

谷歌MapReduce简单介绍入门教程

江湖传说永流传：谷歌技术有”三宝”，GFS、MapReduce和大表（BigTable）！谷歌在03到06年间连续发表了三篇很有影响力的文章，分别是03年…

江海志
2015-09-18