开源项目,开源代码,开源文档,开源新闻,开源社区

环境执行：yum insall -y zlib* pcre* gcc-c++ make lib*

jopen 2013-12-23 33678 0

Nginx Web服务器

Linux下 Nginx安装

jopen 2015-03-03 13713 0

Nginx Web服务器

一直想整理一下这块内容，既然是漫谈，就想起什么说什么吧。我一直是在互联网行业，就以互联网行业来说。先大概列一下互联网行业数据仓库、数据平台的用途：整合公司所有业务数据，建立统一的数据中心；提供各种报表，有给高层的，有给各个业务的；

jopen 2015-10-17 110870 0

数据

P91

数据挖掘十大经典算法国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法：C4

n8uic 2014-03-20 885 0

数据挖掘

P9

引言　　数据库的设计范式是数据库设计所需要满足的规范，满足这些规范的数据库是简洁的、结构明晰的，同时，不会发生插入（insert）、删除（delete）和更新（update）操作异常。反之则是乱七

zhoushugen 2012-07-09 426 0

数据中心通常都是科技企业最为神秘的一个组成部分，但 Google 似乎对此并不以为然，因为该公司刚刚同媒体分享了自己位于全球各地数据中心的内景照片。Google 表示，当你登陆 Google 网站的时

jopen 2014-10-26 4578 0

数据中心

云将很快达成在全球 19 个区域的数据中心提供云计算服务，比其他公共云服务提供商提供了更多的数据中心地区选择。在今天的 TechEd 悉尼会议上，微软正式开放了第 18、19 个 Azure 数据中心，分别在新南威尔士和维多利亚。

jopen 2014-10-26 5254 0

数据中心

相比手机市场调研机构抽象的数字，而一些大型应用发行方提供的数据则相对有趣。新浪微博也算是中国的国民应用之一。据微博的说法，截止 2016 年底，微博的月活跃用户数突破 3 亿，至 3.13 亿，移动端占比高达

jopen 2017-04-17 4011 0

iPhone vivo OPPO 华为小米

2018年，Python仍然是数据科学领域解决重大任务和挑战的佼佼者。去年，我们发了一篇博文，列举了一些被证明是最有用的Python库。今年，我们扩充了原来的清单，并重新审视之前讨论过的库，重点关注在

user_zhou 2018-07-25 23584 0

Python 数据挖掘数据科学 Python开发

html 虽然对于大数据，我是很热爱，技术上也是刚入门，但是我相信通过我的不断努力，我会碰到大数据的一点皮毛的！哈哈哈！！！因为在这个大数据时代，总觉得在互联网公司里处理数据的技术工程师很是高大上。

jopen 2015-09-02 28240 0

大数据

督学习中的聚类算法；二者相同之处：均利用近邻信息来标注类别。聚类是数据挖掘中一种非常重要的学习流派，指将未标注的样本数据中相似的分为同一类，所谓“物以类聚，人以群分”嘛。k-means是聚类算法

QLKJacquett 2016-01-31 17515 0

K-means 算法

其意义就是两个元素在欧氏空间中的集合距离，因为其直观易懂且可解释性强，被广泛用于标识两个标量元素的相异度。将上面两个示例数据代入公式，可得两者的欧氏距离为：（2）除欧氏距离外，常用作度量标量相异度的还

jopen 2016-01-18 24871 0

机器学习

大多数企业大数据应用案例尚处于实验和试点阶段，对于少数首次在生产环境部署Hadoop系统的用户来说，最常遇到的就是扩展问题，此类问题往往导致企业因噎废食，终止大数据应用项目。部署和扩展Hadoo

174384143 2016-08-30 15119 0

Hadoop大数据分布式/云计算/大数据

当今的商业决策对基于天的数据依赖越来越强烈。然而，正确而连贯的数据流对商业用户做出快速、灵活的决策起到决定性的作用。建立正确的数据流和数据结构才能保证最好的结果。这个过程叫做数据建模。为了避免认为错误并

jopen 2016-01-18 10166 0

大数据

P4

2016年大数据和分析市场的21个趋势预测（来源：易达大数据）导读：随着社交媒体、移动化和云计算的发展，数据分析及相关的技术已经作为一款具有颠覆性的技术在这个数字时代占有了一席之地了。在过去的20

leo1986leo 2016-08-06 622 0

大数据分布式/云计算/大数据

P6

大表(Bigtable):结构化数据的分布存储系统 http://labs.google.com/papers/bigtable-osdi06.pdf ｛中是译者评论,程序除外｝ {本文的翻译可能有不准确的地方

f0xf0x 2013-11-21 2191 0

分布式/云计算/大数据

以下的文章主要介绍的是对 MySQL 数据库性能进行优化的的几大绝招，其中包括选取最适用的字段属性，使用连接(JOIN)来代替子查询(Sub-Queries)，使用联合 (UNION)来代替手动创建的临时表的内容介绍。

jopen 2013-01-20 9985 0

MySQL 数据库服务器

大数据我们都知道hadoop，可是还会各种各样的技术进入我们的视野：Spark，Storm，impala，让我们都反映不过来。为了能够更好的架构大数据项目，这里整理一下，供技术人员，项目经理，架构师

jopen 2014-11-22 190566 0

Hadoop 分布式/云计算/大数据

网络技术分为多个层级，下到物理链路层，上到应用层，不同层级运行着不同的协议，有着不同的作用。随着数据中心的发展，网络技术获得了很大发展，网络已经渗透到了世界的各个角落，不过当我们在上网时，经常遇到网

jopen 2015-11-04 7198 0

数据中心网络技术

Elder 译文出处： Sunstone 按照Elder博士的总结，这10大易犯错误包括： 0. 缺乏数据（Lack Data） 1. 太关注训练（Focus on Training）

jopen 2015-08-30 10044 0

数据挖掘

Linux下Nginx安装经验

Linux下Nginx安装经验

大数据环境下互联网行业数据仓库/数据平台的架构之漫谈经验

数据挖掘十大经典算法文档

数据库设计三大范式应用实例剖析文档

Google全球数据中心内部探秘：大到恐怖资讯

微软Azure澳大利亚数据中心正式开放资讯

微博数据显示：国产三强进步快，苹果设备基数大资讯

2018年，20大Python数据科学库都做了哪些更新？经验

2015年大数据顶尖职位必备的9项技能资讯

【十大经典数据挖掘算法】k-means 经验

数据挖掘十大算法--K-均值聚类算法经验

Hadoop大数据系统的七大危险信号经验

最流行的六大数据模型工具资讯

2016年大数据和分析市场的21个趋势预测文档

大表(Bigtable):结构化数据的分布存储系统文档

MySQL数据库性能进行优化三大绝招经验

大数据技术大合集：Hadoop家族、Cloudera系列、spark、storm 经验

基于内容优化数据中心网络的三大技术经验

数据挖掘中易犯的10大错误经验

大数据背景下个人信息安全论文的相关搜索

关键词

Linux下Nginx安装 经验

Linux下Nginx安装 经验

大数据环境下互联网行业数据仓库/数据平台的架构之漫谈 经验

数据挖掘十大经典算法 文档

数据库设计三大范式应用实例剖析 文档

Google全球数据中心内部探秘：大到恐怖 资讯

微软Azure澳大利亚数据中心正式开放 资讯

微博数据显示：国产三强进步快，苹果设备基数大 资讯

2018年，20大Python数据科学库都做了哪些更新？ 经验

2015年大数据顶尖职位必备的9项技能 资讯

【十大经典数据挖掘算法】k-means 经验

数据挖掘十大算法--K-均值聚类算法 经验

Hadoop大数据系统的七大危险信号 经验

最流行的六大数据模型工具 资讯

2016年大数据和分析市场的21个趋势预测 文档

大表(Bigtable):结构化数据的分布存储系统 文档

MySQL数据库性能进行优化三大绝招 经验

大数据技术大合集：Hadoop家族、Cloudera系列、spark、storm 经验

基于内容优化数据中心网络的三大技术 经验

数据挖掘中易犯的10大错误 经验

大数据背景下个人信息安全 论文 的相关搜索

关键词

Linux下Nginx安装经验

Linux下Nginx安装经验

大数据环境下互联网行业数据仓库/数据平台的架构之漫谈经验

数据挖掘十大经典算法文档

数据库设计三大范式应用实例剖析文档

Google全球数据中心内部探秘：大到恐怖资讯

微软Azure澳大利亚数据中心正式开放资讯

微博数据显示：国产三强进步快，苹果设备基数大资讯

2018年，20大Python数据科学库都做了哪些更新？经验

2015年大数据顶尖职位必备的9项技能资讯

数据挖掘十大算法--K-均值聚类算法经验

Hadoop大数据系统的七大危险信号经验

最流行的六大数据模型工具资讯

2016年大数据和分析市场的21个趋势预测文档

大表(Bigtable):结构化数据的分布存储系统文档

MySQL数据库性能进行优化三大绝招经验

基于内容优化数据中心网络的三大技术经验

数据挖掘中易犯的10大错误经验

大数据背景下个人信息安全论文的相关搜索