Contents云计算简介一Java与云计算二云计算实例三云计算在教育中的应用四一、云计算简介1.1云计算的含义云计算是技术还是理念1.1云计算的定义狭义:指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的资源(硬件、平台、软件)。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。这种特性经常被称为像水电一样使用IT基础设施。
Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 QL,它允许熟悉 SQL 的用户查询数据。同时,这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作。
大家都熟悉文件系统,在对HDFS进行分析前,我们并没有花很多的时间去介绍HDFS的背景,毕竟大家对文件系统的还是有一定的理解的,而且也有很好的文档。在分析Hadoop的MapReduce部分前,我们还是先了解系统是如何工作的,然后再进入我们的分析部分。
MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于key/value pair的数据集合,输出中间的基于key/value pair的数据集合;然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足上述处理模型的例子,本论文将详细描述这个模型。
CloudStack云管理平台开源CloudStack的安装<注意:在装系统Centos6.3的时候一定要选择最小化安装>
Service Model Architectures
5 Software as a service (Saas)
The“Platform a sa Service”Model for Networking
Virtualization and Cloud Computing
Experiences with a Private Cloud
云计算:Cloud computing
分布式计算系统简介
Hadoop集群搭建文档
Amazon使用弹性计算云(EC2)和简单存储服务(S3)为企业提供计算和存储服务。 收费的服务项目包括存储服务器、带宽、CPU资源以及月租费。月租费与电话月租费类似,存储服务器、带宽按容量收费,CPU根据时长(小时)运算量收费。 Amazon把云计算做成一个大生意没有花太长的时间:不到两年时间,Amazon上的注册开发人员达44万人,还有为数众多的企业级用户。 有第三方统计机构提供的数据显示,Amazon与云计算相关的业务收入已达1亿美元。云计算是Amazon增长最快的业务之一。
帮助读者快速掌握hadoop的安装和部署HDFS,Hbase,Hive等组件。Hadoopt是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的硬件上。而且它提供高传输率来访问应用程序的数据,适合那些有着超大数据集的应用程序。
Yarn背景Yarn是一个分布式的资源管理系统,用以提高分布式的集群环境下的资源利用率,这些资源包括内存、IO、网络、磁盘等。其产生的原因是为了解决原MapReduce框架的不足。最初MapReduce的committer们还可以周期性的在已有的代码上进行修改,可是随着代码的增加以及原MapReduce框架设计的不足,在原MapReduce框架上进行修改变得越来越困难,所以MapReduce的committer们决定从架构上重新设计MapReduce,使下一代的MapReduce(MRv2/Yarn)框架具有更好的扩展性、可用性、可靠性、向后兼容性和更高的资源利用率以及能支持除了MapReduce计算框架外的更多的计算框架。
自从大四下学期加入新蛋bigdata团队以来,一直利用业余时间学习hadoop生态系统的相关技术,学习的方式主要是跟踪业界大神的博客以及hadoop官方的文档,自己也利用公司淘汰下来的机器搭建了一个简单的hadoop集群来测试。当学习完系统架构后自然要去读hadoop源码,从源码层面了解hadoop的设计。
我这里所讲的是hadoop-0.20.2-cdh3u1 版本已regular方式启动时的代码流程分析。在namenode启动时会首先去构造Configuration对象,这个对象会贯穿代码的整个执行过程,不过在构造的时候它并没有去加载解析core-site.xml,hdfs-site.xml等配置文件,而是在第一次要使用到这些配置的时候才去解析,解析后保存在Configuration类里的一个Properties的对象里。在这之后才真正的去用Namenode的构造方法构造Namenode对象。
云服务提供的灵活性,可扩展性和规模效应,出现了有关安全相称的担忧。由于更多数据从位于中心服务器的详细数据移动存储到云,相应个人的和私有的数据的安全也要增加。如果没有采取适当的措施选择云供应商或实现自己的云,把数据转移到云服务器,那么其保密性、可用性和数据的完整性将受到威胁。摘要云服务,例如软件即服务,平台即服务,基础设施即服务,他们都有自己需要担心的安全需求。
1.用户使用指南1.1登陆搭建好OpenStack云计算平台后,访问http://control_IP/horizon,在本使用手册中,control_IP为192.168.1.232,因此,访问http://192.168.1.232/horizon,界面如下图所示:输入用户名和密码,本使用手册中的用户名为admin,密码也是admin,登陆成功后进入主页面,如下图所示:因为admin具有管理员权限,所以登陆成功后会进入“管理员”管理界面,如果是普通用户,则会直接进入“项目”界面。