P4

  2016年数据和分析市场的21个趋势预测 文档

2016年数据和分析市场的21个趋势预测 (来源:易达大数据)导读:随着社交媒体、移动化和云计算的发展,数据分析及相关的技术已经作为一款具有颠覆性的技术在这个数字时代占有了一席之地了。在过去的20

P6

  表(Bigtable):结构化数据的分布存储系统 文档

表(Bigtable):结构化数据的分布存储系统 http://labs.google.com/papers/bigtable-osdi06.pdf {中是译者评论,程序除外} {本文的翻译可能有不准确的地方

f0xf0x 2013-11-21   2191   0

MySQL数据库性能进行优化三绝招 经验

以下的文章主要介绍的是对 MySQL 数据库 性能进行优化的的几绝招,其中包括选取最适用的字段属性,使用连接(JOIN)来代替子查询(Sub-Queries),使用联合 (UNION)来代替手动创建的临时表的内容介绍。

jopen 2013-01-20   9985   0

数据技术合集:Hadoop家族、Cloudera系列、spark、storm 经验

数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来。为了能够更好 的架构大数据项目,这里整理一下,供技术人员,项目经理,架构师

jopen 2014-11-22   190566   0

基于内容优化数据中心网络的三技术 经验

网络技术分为多个层级,下到物理链路层,上到应用层,不同层级运行着不同的协议,有着不同的作用。随着数据中心的发展,网络技术获得了很大发展,网络已经渗透到了世界的各个角落,不过当我们在上网时,经常遇到网

jopen 2015-11-04   7198   0

数据挖掘中易犯的10错误 经验

Elder 译文出处: Sunstone 按照Elder博士的总结,这10易犯错误包括: 0. 缺乏数据(Lack Data) 1. 太关注训练(Focus on Training)

jopen 2015-08-30   10044   0

数据挖掘十算法--K近邻算法 经验

四、对 k - 近邻算法的说明 按距离加权的 k - 近邻算法是一种非常有效的归纳推理方法。它对训练数据中的噪声有很好的鲁棒性,而且当给定足够大的训练集合时它也非常有效。注意通过取 k 个近邻的加权平均,可以消除孤立的噪声样例的影响。

jopen 2016-01-18   24663   0

NewSQL数据对象块存储原理与应用 经验

SequoiaDB的对象机制主要为用户存储海量中小型文件所设计。通过配置pagesize大小,SequoiaDB在存储100KB到100MB区间内的文件性能与磁盘开销比例最优,因此针对各个企业的票据

MichelineSk 2016-08-20   45218   0
SequoiaDB   NewSQL   SQL  

保障 Hadoop 数据安全的十措施 资讯

Dataguise最近发布了Hadoop十数据安全措施,内容涵盖隐私风险、数据管理和信息安全等,可以帮助专业人士降低大数据应用的潜在数据泄漏和政策违规等风险,对于那些考虑部署Hadoop的企业来说非常值得参考。

jopen 2013-04-07   6904   0
Hadoop  

深度学习和拓扑数据分析的六惊人之举 资讯

Analysis can do with 假如你有一个一千列和一百万行的数据集。无论你从哪个角度看它——小型,中型或大型的数据——你不可能看到它的全貌。将它放大或缩小。使它能够 在一个屏幕里显示完全。

cnffe 2015-11-04   7224   0

2016年最值得关注的大数据领域33预测 资讯

1、数据平民崛起 甲骨文公司预测一种新型用户:数据平民(Data Civilian)会崛起。该公司称:“虽然复杂的数据统计可能仍局限于数据科学家,但数据驱动的决策不会是这样。在未来一年,更简单的大

勿忘初心321 2016-01-06   30248   1

针对2016年数据发展形势的预测 资讯

【51CTO.com快译】2016年数据技术将迎来怎样的发展态势?预计机器学习、实时数据即服务、算法市场以及Spark等等都将成为发展热点。 1.首席数据官全面崛起 随着企业努力克服由变

jopen 2016-01-07   18773   0
P15

  张文霖 数据分析技能提升十建议 文档

1. 数据分析技能提升十建议小蚊子http://blog.sina.com.cn/xiaowenzi22 2. 一、熟悉行业、公司业务熟悉行业、公司业务及流程,若脱离行业认知和公司业务背景,分析的结

loele 2015-08-03   2690   0

Go语言5基本数据类型解析 经验

Go语言目前也比较热门,本文主要来讨论一下Go语言的5基本数据类型以及其使用方法。Go语言的基本数据类型包括注释、标识符、常量、变量以及布尔值,下面我们逐一来对这些数据类型进行分析。 1、注释(与C++一样)

jopen 2015-03-09   13321   0

数据挖掘算法及各自优势 经验

Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank

jopen 2014-09-04   36897   0
算法  

数据挖掘十经典算法(详解) 经验

数据挖掘十经典算法 一、 C4.5 C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3 算法.   C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进:

jopen 2016-01-18   100815   0

数据挖掘十算法----EM算法(最大期望算法) 经验

无法观测的隐藏变量(Latent Variable)。 最大期望经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。 可以有一些比较形象的比喻说法把这个算法讲清楚。

jopen 2016-01-18   18478   0

“盛云”MongoIC上线 首次支持数据库恢复 资讯

10月20日消息,“盛云”今日宣布旗下产品 MongoIC 正式对外开放,这是中国第一家专业的 MongoDB 云服务,也是全球第一家支持数据库恢复的 MongoDB 云服务。 “盛云”MongoIC

fmms 2011-10-21   5920   0
P1

  云服务需要重视的6数据安全问题 文档

云服务需要重视的6数据安全问题  云服务现在是铺天盖地的覆盖在各个saas应用中,而如下数据安全问题需要重视。  1:数据分类存储   并非所有数据都需要同等级别的保护,所以企业应该把用于云存储的数据分类,然

benifit 2015-01-15   574   0
P74

  Oracle数据库备份与恢复之六总结 文档

Oracle数据库备份与恢复之六总结 目录 之一:exp/imp(导出与导入装库与卸库) 1 1.1  基本命令 1 1.2  高级选项 3 1.3  优化 5 1.4  常见问题 8 之二:SQL*Loader

libaigang 2013-03-25   541   0
1 2 3 4 5 6 7 8 9 10