DataCleaner 是一个数据质量分析,比较,验证和监督的软件。 DataCleaner包括一个独立的图形用户界面分析,比较和验证,并进行监测web应用。 DataCleaner 2.3 发布了,主要改进:
网络数据采集分析工具TcpDump 可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤,并提供and、or、not等逻辑语句来帮助你去掉无用的信息。t
为了更为顺畅地实现Hadoop基础之上的高级与实时分析目标,Apache Spark凭借着自身的出色表现很快成为大数据领域的新核心。 在过去几年当中,随着Hadoop逐步成为大数据处理领域的主导性解决思路,原本存在
们发现并保存有创意的想法,目前这家公司正使用实时数据分析来达到以数据驱动决策的目的。 实验 中使用了 MemSQL 和 Spark 这样的技术,用以分析来自全球的用户实时行为信息。 通过MemSQ
了Hadoop上自助服务 SQL 查询的空缺,尤其复杂动态 NoSQL 数据类的查询。它的一大性能优势是能够访问Hadoop数据,和 Qlik 一起使用的话,体验更佳。 此版本现已提供下载: 直接下载文件:
信息爆炸引爆了大数据时代的到来,前一两年大数据到达了炒作的高峰,而马云则称今后 30年 属于数据技术(DT)。但是最近一段时间大数据似乎没有那么大的动静了,这固然有技术炒作周期曲线的规律作用,也跟大数据遭遇到的一些瓶颈有关。
Platfora 这是一款大数据发现和分析平台。 Qlikview 这是一款引导分析平台。 Sisense 这是一款商业智能软件,专门处理复杂数据的商业智能解决方案。 Sqream
一、数据源。这个可以是各种形式的数据库。当然,你如果有高大上的Hadoop也是可以的。 二、分析引擎。就是R了,这里我们使用Rserve搭建一个服务。 三、分析脚本容器。根据每一个数据分析需
多个分区,这些分区运行在集群中的不同节点上。 2、用户可以使用两种方法创建RDD:读取一个外部数据集,以及在驱动器程序中对一个集合进行并行化(比如list和set)。 创建RDD最简单的方式就
甲骨文公司(Oracle)发表声明,表示将会收购大型数据分析公司 DataRaker,该公司致力于研发应用于燃气与电力产业智能仪表的数据分析软件。 由于 DataRaker 规模较小,也是一家私有
jHepWork是一套功能完整的面向对象科学数据分析框架。 Jython宏是用来展示一维和二维直方图的数据。该程序包括许多工具,可以用来和二维三维的科学图形进行互动。 项目地址: http://jwork
DataCleaner 是一个数据质量分析,比较,验证和监督的软件。 DataCleaner包括一个独立的图形用户界面分析,比较和验证,并进行监测web应用。 DataCleaner 2.5.2 发布了,增加对
李普君 作者:猪猪侠( @王音 ) 泄露数据的条数 8281387 条 具体被脱裤时间 2012-06-15 14:08 开始被传播时间 2014/5/13 15:51 上传百度盘时间 2014-5-13
我从事数据分析工作已经有十年之久。最初是出于工作需要,我的经理给我一堆数据,我需要处理这些数据。当时我一直使用的工具是 Excel,因为这是我熟练掌握的一款工具。三年前,我开始接触到 R,一开始因为功
提供了一个统一数据分析接口。通过提供一个跨多个数据存储的单一视图来实现数据分析任务切分,同时优化了执行的环境。无缝的集成 Hadoop 实现类似传统数据仓库的功能。 该项目主要特性: 简单元数据层为数据存储提供抽象视图层
是一种交互式并行可视化访问和图形的分析工具,用来查看科学数据。用户可以从他们能快速生成可视化数据,随着时间而动态显示,操纵他们,保存用来展现的结 果图像。Visit含有丰富套可视化功能,以便你可以各种不同的方式查看你的数据。它可以用来观察二维和三维标量和向量字段(2
一个可视化界面对来自Go程序运行时数据进行分析。 Installation go get github.com/rakyll/gometry/cmd/gometry The program you're
是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性;我们还需要跨学科的团队,而不是单个数据科学家、设计师或数据分析员;我们更需要重新思考我们所知道的数据可视化,
net/article/2015-06-15/2824958 数据科学家们早已熟悉的R和Pandas等传统数据分析框架 虽然提供了直观易用的API,却局限于单机,无法覆盖分布式大数据场景。在Spark 1.3.0以Spark
DRUID是一个面向时间序列数据的实时分析型数据库。 系统设计目标: 快速的聚集和drill down能力。 任意维度组合查询希望在亚秒级返回。 多租户和高可用。 亚秒级data ingestion。