开源项目,开源代码,开源文档,开源新闻,开源社区

通信世界网消息(CWW) “这是一个人人都在谈大数据的时代，但只有极少数人在用大数据。”阿里云大数据事业部资深总监徐常亮说，2016年才是真正意义上的大数据元年。 1月20日，阿里云在2016云栖大

jopen 2016-01-19 20052 0

大数据阿里云

自某著名传播集团的公关透露，2016年整体效益不容乐观，所幸的是我们是国际性企业，“瘦死的骆驼比马大”，非常时期尚可拆东补西，勉强应付。值得一提的是，相对2015年中国整体广告市场2.9%的下降率和传统广告7

yxlk888 2017-03-07 765 0

大数据百度微信 C/C++ Git

P29

1. 海量数据处理的大杀器 ——腾讯分布式数据仓库(TDW)2012年7月腾讯公司郭玮 2. Agenda 腾讯公司的海量数据处理平台腾讯分布式数据仓库（TDW） TDW的技术点分享 TDW技术发展展望

andyxiemu 2012-08-13 1111 0

分布式/云计算/大数据方案 SQL

BubbleSort（冒泡排序）定义：在同一个数组中，从数组第一个数开始，相邻两个数进行比较，按照小左大右或者大右小左的顺序，依次循环遍历，进行排序！ void BubbleSort(int *arr,int

深蓝de星球 2016-11-22 5232 0

插入排序二叉树快速排序

P91

数据挖掘十大经典算法国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法：C4

n8uic 2014-03-20 885 0

数据挖掘

引言　　数据库的设计范式是数据库设计所需要满足的规范，满足这些规范的数据库是简洁的、结构明晰的，同时，不会发生插入（insert）、删除（delete）和更新（update）操作异常。反之则是乱七

zhoushugen 2012-07-09 426 0

数据中心通常都是科技企业最为神秘的一个组成部分，但 Google 似乎对此并不以为然，因为该公司刚刚同媒体分享了自己位于全球各地数据中心的内景照片。Google 表示，当你登陆 Google 网站的时

jopen 2014-10-26 4578 0

数据中心

云将很快达成在全球 19 个区域的数据中心提供云计算服务，比其他公共云服务提供商提供了更多的数据中心地区选择。在今天的 TechEd 悉尼会议上，微软正式开放了第 18、19 个 Azure 数据中心，分别在新南威尔士和维多利亚。

jopen 2014-10-26 5254 0

数据中心

相比手机市场调研机构抽象的数字，而一些大型应用发行方提供的数据则相对有趣。新浪微博也算是中国的国民应用之一。据微博的说法，截止 2016 年底，微博的月活跃用户数突破 3 亿，至 3.13 亿，移动端占比高达

jopen 2017-04-17 4011 0

iPhone vivo OPPO 华为小米

2018年，Python仍然是数据科学领域解决重大任务和挑战的佼佼者。去年，我们发了一篇博文，列举了一些被证明是最有用的Python库。今年，我们扩充了原来的清单，并重新审视之前讨论过的库，重点关注在

user_zhou 2018-07-25 23584 0

Python 数据挖掘数据科学 Python开发

督学习中的聚类算法；二者相同之处：均利用近邻信息来标注类别。聚类是数据挖掘中一种非常重要的学习流派，指将未标注的样本数据中相似的分为同一类，所谓“物以类聚，人以群分”嘛。k-means是聚类算法

QLKJacquett 2016-01-31 17515 0

K-means 算法

其意义就是两个元素在欧氏空间中的集合距离，因为其直观易懂且可解释性强，被广泛用于标识两个标量元素的相异度。将上面两个示例数据代入公式，可得两者的欧氏距离为：（2）除欧氏距离外，常用作度量标量相异度的还

jopen 2016-01-18 24871 0

机器学习

大多数企业大数据应用案例尚处于实验和试点阶段，对于少数首次在生产环境部署Hadoop系统的用户来说，最常遇到的就是扩展问题，此类问题往往导致企业因噎废食，终止大数据应用项目。部署和扩展Hadoo

174384143 2016-08-30 15119 0

Hadoop大数据分布式/云计算/大数据

当今的商业决策对基于天的数据依赖越来越强烈。然而，正确而连贯的数据流对商业用户做出快速、灵活的决策起到决定性的作用。建立正确的数据流和数据结构才能保证最好的结果。这个过程叫做数据建模。为了避免认为错误并

jopen 2016-01-18 10166 0

大数据

大表(Bigtable):结构化数据的分布存储系统 http://labs.google.com/papers/bigtable-osdi06.pdf ｛中是译者评论,程序除外｝ {本文的翻译可能有不准确的地方

f0xf0x 2013-11-21 2191 0

分布式/云计算/大数据

以下的文章主要介绍的是对 MySQL 数据库性能进行优化的的几大绝招，其中包括选取最适用的字段属性，使用连接(JOIN)来代替子查询(Sub-Queries)，使用联合 (UNION)来代替手动创建的临时表的内容介绍。

jopen 2013-01-20 9985 0

MySQL 数据库服务器

大数据我们都知道hadoop，可是还会各种各样的技术进入我们的视野：Spark，Storm，impala，让我们都反映不过来。为了能够更好的架构大数据项目，这里整理一下，供技术人员，项目经理，架构师

jopen 2014-11-22 190566 0

Hadoop 分布式/云计算/大数据

网络技术分为多个层级，下到物理链路层，上到应用层，不同层级运行着不同的协议，有着不同的作用。随着数据中心的发展，网络技术获得了很大发展，网络已经渗透到了世界的各个角落，不过当我们在上网时，经常遇到网

jopen 2015-11-04 7198 0

数据中心网络技术

Elder 译文出处： Sunstone 按照Elder博士的总结，这10大易犯错误包括： 0. 缺乏数据（Lack Data） 1. 太关注训练（Focus on Training）

jopen 2015-08-30 10044 0

数据挖掘

四、对 k - 近邻算法的说明按距离加权的 k - 近邻算法是一种非常有效的归纳推理方法。它对训练数据中的噪声有很好的鲁棒性，而且当给定足够大的训练集合时它也非常有效。注意通过取 k 个近邻的加权平均，可以消除孤立的噪声样例的影响。

jopen 2016-01-18 24663 0

机器学习

大数据的相关搜索

1 2 3 4 5 6 7 8 9 10

关键词

大数据，数据分析，认知时代，商业智能分布式/云计算/大数据大数据分析 Hadoop大数据大数据 storm 大数据加一减一大数据 storm可视化大数据企业架构，云计算，hadoop 大数据hadoop，公开课云储存大数据云安全 Hadoop 大数据 NOSQL SQL 数据库 Hadoop 互联网 Node.js 数据挖掘检查工具图片处理 KnowledgeRoot IPFire MapReduce 大数据机器学习可视化 Spark 深度学习 HDFS 软件架构

阿里云推出“数加”平台开放十年大数据能力资讯

2017年大数据会是广告市场最后一根救命草吗？问答

海量数据处理的大杀器 - 腾讯分布式数据仓库(TDW) 文档

十大排序大总结经验

数据挖掘十大经典算法文档

数据库设计三大范式应用实例剖析文档

Google全球数据中心内部探秘：大到恐怖资讯

微软Azure澳大利亚数据中心正式开放资讯

微博数据显示：国产三强进步快，苹果设备基数大资讯

2018年，20大Python数据科学库都做了哪些更新？经验

【十大经典数据挖掘算法】k-means 经验

数据挖掘十大算法--K-均值聚类算法经验

Hadoop大数据系统的七大危险信号经验

最流行的六大数据模型工具资讯

大表(Bigtable):结构化数据的分布存储系统文档

MySQL数据库性能进行优化三大绝招经验

大数据技术大合集：Hadoop家族、Cloudera系列、spark、storm 经验

基于内容优化数据中心网络的三大技术经验

数据挖掘中易犯的10大错误经验

数据挖掘十大算法--K近邻算法经验

大数据的相关搜索

关键词

阿里云推出“数加”平台 开放十年大数据能力 资讯

2017年大数据会是广告市场最后一根救命草吗？ 问答

海量数据处理的大杀器 - 腾讯分布式数据仓库(TDW) 文档

十大排序大总结 经验

数据挖掘十大经典算法 文档

数据库设计三大范式应用实例剖析 文档

Google全球数据中心内部探秘：大到恐怖 资讯

微软Azure澳大利亚数据中心正式开放 资讯

微博数据显示：国产三强进步快，苹果设备基数大 资讯

2018年，20大Python数据科学库都做了哪些更新？ 经验

【十大经典数据挖掘算法】k-means 经验

数据挖掘十大算法--K-均值聚类算法 经验

Hadoop大数据系统的七大危险信号 经验

最流行的六大数据模型工具 资讯

大表(Bigtable):结构化数据的分布存储系统 文档

MySQL数据库性能进行优化三大绝招 经验

大数据技术大合集：Hadoop家族、Cloudera系列、spark、storm 经验

基于内容优化数据中心网络的三大技术 经验

数据挖掘中易犯的10大错误 经验

数据挖掘十大算法--K近邻算法 经验

大数据 的相关搜索

关键词

阿里云推出“数加”平台开放十年大数据能力资讯

2017年大数据会是广告市场最后一根救命草吗？问答

十大排序大总结经验

数据挖掘十大经典算法文档

数据库设计三大范式应用实例剖析文档

Google全球数据中心内部探秘：大到恐怖资讯

微软Azure澳大利亚数据中心正式开放资讯

微博数据显示：国产三强进步快，苹果设备基数大资讯

2018年，20大Python数据科学库都做了哪些更新？经验

数据挖掘十大算法--K-均值聚类算法经验

Hadoop大数据系统的七大危险信号经验

最流行的六大数据模型工具资讯

大表(Bigtable):结构化数据的分布存储系统文档

MySQL数据库性能进行优化三大绝招经验

基于内容优化数据中心网络的三大技术经验

数据挖掘中易犯的10大错误经验

数据挖掘十大算法--K近邻算法经验

大数据的相关搜索