为 Ruby 程序员准备的 Go 入门教程
那些在Google的大牛们开发出了一种称为Go的牛叉的语言。乍一看,Ruby和Go有点像远房表亲。其实不然,他们那些互为补充的功能却让他们成为一对完美组合。
Ruby程序员花时间了解一下Go还是非常有好处的,因为Go语言中一些创新之举还是很有不错的。
对于我来说,Go弥补了C++和Ruby之间空缺的联系。特别是当需要实现高响应的服务器的时候,我通常会选择C++,但是这样我就丢失了Ruby的精细之处。虽然我比较偏爱Ruby,可是即便是最近,当需要性能有明显提高的时,Ruby还是应付不来。
Go弥补了这个空缺。它提供像Ruby和Python这样动态语言的感觉的同时,也提供了编译语言的性能。
Go同时有一些与众不同的特性,本文会详细介绍。好了,让我们好好瞧瞧吧。
Go好在哪?
当写一个服务器的时候,一种实现并发的方式是为每个客户端开一个线程(你可能会觉得是在扯淡,好吧!没关系,继续读下去),特别是有许多客户端的时候,这种方式是非常糟糕的。较为好的解决方法是选择非阻塞IO(大家肯定表示赞同吧)。可是,即便都是Unix系的操作系统(诸如Linux,Mac OS X等等),有效地处理非阻塞IO的机制也是各不相同。此外,除了这些纷繁混杂,还有个C语言。我绝不反对嵌入式设备使用C语言,因为那绝对是速度第一,开发时间第二的。但是,作为一门日常语言,C已经不能满足我的需求了。
Go提供了令人惊讶的并发基元(primitives),良好的语法,优秀的函数库和快速的编译器。它解决我在使用C(某种程度上C++也是)遇到的问题。即使是基础代码变得很大的时候,使用Go语言依然很轻松。
在这篇文章中,我会依据文档,快速的回顾一下Go语言的基础特性。我们的重点在于突出那些让Go语言与众不同的创新之举。
无聊的基础介绍
Go语言是很容易上手,在基本语法这方面没玩什么新花样。下面是些基本代码:
package main func main() { }我们从main函数开始。好了,试着输出个“Hello,world”吧!
package main import "fmt" func main() { fmt.Println("Hello, world!") }
Go语言中输入输出模块被称作“fmt”,不像Ruby,这个“fmt”是默认不被包含的。所以需要在文件开始处用“import”声明引入。“fmt”模块中的Println函数会将你传入的字符串加上一个换行符一起输出(类似ruby的puts函数)。注意Go语言中公共方法是以大写字母开头的。
下面看一下简单的循环:
package main import "fmt" func main() { //the basic for loop for i:=1; i < 100; i++ { fmt.Println(i) } }对于for循环,Go语言和Ruby完全不同。Go语言的for循环或多或少有点像C语言。你需要先定义个变量,然后检查状态,最后说明在迭代一次结束后需要做什么事(这个例子是i递增)。Go语言中的基本循环语法只有这一种。幸运的是,这个for循环非常灵活。比如说,下面这个死循环:
for { }
我希望你能查看一些有个for的文档[http://golang.org/doc/effective_go.html#for].
请注意在我们的上面的for循环中,给变量i赋值的时候,我们没有用“=”,而是使用了“:=”。这儿有个说明差异的例子:
package main import "fmt" func main() { //defines the variable a a := 5 fmt.Println(a) //sets a different value to a a = 10 fmt.Println(a) //another way to define a variable var b int b = 15 fmt.Println(b) }
在main函数的开始,在声明变量a的同时进行了初始化,所以使用“:="。接下来的是简单的赋值,所以使用“=”。之所以这样,是因为实际上Go语言是静态类型语言,不像Ruby这样的动态类型。因此编译器必须得知道这个变量在哪声明和在哪赋值的。最后一部分代码比较清楚,就是简单地使用var关键字声明变量,然后进行赋值。
最后,作为和Ruby中数组的一个相似点,在Go语言中的数组也有分片。下面的代码中有个[]type的类型,这个type意思是着你希望分片返回的类型。但是这样的做法有点变扭 :
package main func main { ///this creates a slice of integers with length 15 mySlice := make([]int, 15) }
我们需要make()函数来获得一个分片。
如果这样继续下去的话,文章就可能成为Go语言语法的的简明教程。而我更希望将时间花费在一些有意思的新特性上,而不是这样的一个语法介绍。基本语法可以参照Go语言的文档,那会介绍得更好。
下面让我们看看goroutines吧。
Goroutines
写并发的代码已经很困难了,写并发访问网络的代码就更加困难了。问题在于传统的线程不能很好得伸缩,而且线程一旦运行起来,就会很难去控制。Go语言项目组着手解决这个问题,于是乎goroutine就诞生了。
本质上, goroutines是个轻量级的并发机制,通过使用一种称为channels的构建来进行线程间交互。它们都非常易于使用:
package main import "fmt" func wait() { //wait around with a forever loop for { } } func main() { go wait() fmt.Println("We didn't wait because it was called as a goroutine!") }
在上面的代码中,wait方法是一个死循环,但是我们通过go wait()的方式来调用,而非直接的通过wait()来调用。这是告诉Go我们希望以一个goroutine的方式来调用,同时异步运行。既然这个循环是在后台运行的,那样运行这个程序就不会因为死循环而阻塞。
这么说,Go从语言本身支持并发。也就是,Go语言中有并发基元(primitives)。这样意义何在呢?仅仅因为不是由某个库或者模块来实现并发,这好像不是什么了不起的举措啊。但是,实际上goroutine从根本上与线程不同。goroutine更加轻量化。还记得在服务器中,我们不该为每个客户端创建一个线程吧?但是,使用goroutine,情况就不同了:
package main import ( "fmt" "net" ) //notice that in the arguments, the name of //the variable comes first, then comes the //type of the variable, just like in "var" //declarations func manageClient(conn net.Conn) { conn.Write([]byte("Hi!")) conn.Close() //do something with the client } func main() { //we are creating a server her that listens //on port 1337. Notice that, similar to Ruby, //a method can have two return values (although //in Ruby, this would be an array instead) listener, err := net.Listen("tcp", ":1337") for { //accept a connection connection, _ := listener.Accept() go manageClient(connection) } }
噢,等会!这些代码似有那么一小点复杂啊,虽然想法是很简单。好吧,让我们一步一步慢慢来
首先,我们来看一下main函数。在main函数一开始调用了net.Listen方法,该方法会返回两个值,一个是服务器连接,另一个是错误消息。然后,进入到服务的主循环部分,在这儿程序调用server.Accept方法,然后等待请求。该方法调用后,程序会被挂起,直到有有一个客户端的连接出现。一旦有个连接出现,我们将connection对象传值到manageClient方法中,由于通过goroutine的方式调用manageClient,所以主程序会继续等待处理下一个客户端连接请求。
最后,关于这个manageClient方法要注意一下。首先,注意一下参数表,是变量名在先,类型在后。这样的格式多少是由Go语言创造者决定的。你可能甚至可能一周后都没有注意到。
在方法体中,向客户端写入“Hi!”信息,然后关闭套接字。
好了,就这么几行代码,我们轻松完成了一个基础服务器。你可以将它改成一个HTTP代理(如果加上缓存,那就更棒了)。Goroutines支持我们这么做。事实上goroutine不单单是一个轻量级的线程,因为还有许多与众不同的机制在背后在起着作用,所以才可以通过如此简练的代码的来实现goroutine功能。
Channels
虽然,单纯只有Goroutines已经很有作用了,但是如果在channels概念的支持下,那么Goroutines将更具威力。Channels是一种goroutine之间或者goroutine和主进程之间的通信机制。让我们来看个简单的实例。
package main import ( "fmt" ) var eventChannel chan int = make(chan int) func sayHello() { fmt.Println("Hello, world!") //pass a message through the eventChannel //it doesn't matter *what* we actually send across eventChannel < - 1 } func main() { //run a goroutine that says hello go sayHello() //read the eventChannel //this call blocks so it waits until sayHello() //is done <- eventChannel }
程序中有个调用了sayHellothat方法的goroutine,该方法输出 “Hello, world”消息。但是,注意那个eventChannel的声明。本质上,我们声明了一个整型的channel。我们可以通过这个channel来发送数据,而其他部分可以从这个channel中读取数据。这就使得channel成为了一种通信方式。在 sayHello方法中,eventChannel < - 1将整数1加入到eventChannel中,然后在主函数中,我们可以从 eventChannel将数据读出。
这儿有一点很重要:默认情况下,如果channel中没有数据的情况下,从channel中读数据会被阻塞的,一直阻塞到可以从channel中读到数据。
来的稍微复杂的:
package main import ( "fmt" ) var logChannel chan string = make(chan string) func loggingLoop() { for { //wait for a message to arrive msg := < - logChannel //log the msg fmt.Println(msg) } } func main() { go loggingLoop() //do some stuff here logChannel <- "messaged to be logged" //do other stuff here }
这里,我们完成了一个main的事件轮询,它会一直处于监听事件状态,也就是loggingLoop函数。它从loggChanne中接收到一个消息后,就会输到屏幕。这是一个非常普片的设计,特别在事件轮询中获得一些状态。
就这样,短短几行代码,我们就完成了一个main函数和goroutines之间的通信。由于共享内存的通信方式,存在着诸如互斥锁,竞态条件等问题,早已成为了开发者的噩梦。但是在Go中,channels的概念解决了多数传统问题。此外,Go的channels是语言的固有部分,而非附加在某个库中的。
与Ruby相比,Go的goroutines实际上是运行在后台,并且由语言本身实现的(MRI Ruby整个运行在一个单独的线程中,所以它不能提供一个真实的并行)。此外,虽然Ruby自带线程实现,但是那实在不好使用。事实上,Agent库尝试将一些goroutines精妙的地方引入Ruby中去。
告一段落 (暂时)
这篇文章我们已经讲了不少东西了,首先介绍了一些非常基础的语法,然后直接介绍了Go语言的并发机制。
请继续关注后续的第2部分,那里我们会接触一些复杂语法,和其他一些Go语言带给我们的牛叉特性。