PythonBeautifulSoupBeautifulSoup是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.BeautifulSoup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。
selenium 技术元素定位的几种方法: WebDriver API ,selenium IDE,selenium grid python 技术函数、类、方法;读写文件,unitest单元测试框架,HTMLTestRunner.py,发邮件模块,多线程技术等。
Fiddler是最强大最好用的Web调试工具之一,它能记录所有客户端和服务器的http和https请求,允许你监视,设置断点,甚至修改输入输出数据,Fiddler包含了一个强大的基于事件脚本的子系统
蓝牙设备之间可互相探查,进行连接形成自组网 48位的设备地址BD_ADDR 发起连接的那个设备叫主单元,其余被连接的为从单元 从单元被暂时分配一个3位的活跃成员地址AM_ADDR 由一个主单元和一个或多个从单元组成的自组网称为微微网 ,一个微微网最多只可以有7个从单元 由多个这种微微网结合形成了散射网
课程目标: 掌握程序设计语言开发的一般步骤 编译并运行Java应用程序 理解并使用Java的在线帮助文档 理解Java语言的语法元素和结构特点 理解面向对象程序设计的一般特性,并且能使用这些特性 理解并使用Java异常处理机制
JSP全称是Java Server Pages,它和servle技术一样,都是SUN公司定义的一种用于开发动态web资源的技术。 JSP这门技术的最大的特点在于,写jsp就像在写html,但: 它相比html而言,html只能为用户提供静态数据,而Jsp技术允许在页面中嵌套java代码,为用户提供动态数据。 相比servlet而言,servlet很难对数据进行排版,而jsp除了可以用java代码产生动态数据的同时,也很容易对数据进行排版。 Jsp快速入门:在jsp页面中输出当前时间。
Python爬虫许超英python爬虫基础知识:Python基础知识Python中urllib和urllib2库的用法Python正则表达式Python爬虫框架ScrapyPython爬虫更高级的功能Python中urllib2库的用法urllib2是爬取网页非常重要的一个库:importurllib2response=urllib2.urlopen(“http://www.baidu.com”)urllib2.urlopen()printresponse.read()urllib2库的高级应用1.设置Headers有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,需要设置一些Headers的属性。agent就是请求的身份,如果没有写入请求身份,那么服务器不一定会响应,所以可以在headers中设置agent。urllib2库的高级应用headers的一些属性,下面的需要特别注意一下:User-Agent:有些服务器或Proxy会通过该值来判断是否是浏览器发出的请求Content-Type:在使用REST接口时,服务器会检查该值,用来确定HTTPBody中的内容该怎样解析。application/xml:在XMLRPC,如RESTful/SOAP调用时使用application/json:在JSONRPC调用时使用application/x-www-form-urlencoded:浏览器提交Web表单时使用在使用服务器提供的RESTful或SOAP服务时,Content-Type设置错误会导致服务器拒绝服务urllib2库的高级应用2.Proxy(代理)的设置urllib2默认会使用环境变量http_proxy来设置HTTPProxy。假如一个网站它会检测某一段时间某个IP的访问次数,如果访问次数过多,它会禁止你的访问。所以你可以设置一些代理服务器来帮助你做工作,每隔一段时间换一个代理,网站君都不知道是谁在捣鬼了,这酸爽!3.Timeout设置urlopen方法中,第三个参数就是timeout的设置,可以设置等待多久超时,为了解决一些网站实在响应过慢而造成的影响。importurllib2response=urllib2.urlopen('http://www.baidu.com',timeout=10)4.使用HTTP的PUT和DELETE方法http协议有六种请求方法,get,head,put,delete,post,options,我们有时候需要用到PUT方式或者DELETE方式请求。PUT:这个方法比较少见。HTML表单也不支持这个。本质上来讲,PUT和POST极为相似,都是向服务器发送数据,但它们之间有一个重要区别,PUT通常指定了资源的存放位置,而POST则没有,POST的数据存放位置由服务器自己决定。DELETE:删除某一个资源。基本上这个也很少见,不过还是有一些地方比如amazon的S3云服务里面就用的这个方法来删除资源。5.使用DebugLog可以通过下面的方法把DebugLog打开,这样收发包的内容就会在屏幕上打印出来,方便调试,这个也不太常用importurllib2httpHandler=urllib2.HTTPHandler(debuglevel=1)httpsHandler=urllib2.HTTPSHandler(debuglevel=1)opener=urllib2.build_opener(httpHandler,httpsHandler)urllib2.install_opener(opener)response=urllib2.urlopen('http://www.baidu.com')URLError首先解释下URLError可能产生的原因:网络无连接,即本机无法上网连接不到特定的服务器服务器不存在HTTPERRORHTTPError是URLError的子类,在你利用urlopen方法发出一个请求时,服务器上都会对应一个应答对象response,其中它包含一个数字”状态码”。举个例子,假如response是一个”重定向”,需定位到别的地址获取文档,urllib2将对此进行处理。其他不能处理的,urlopen会产生一个HTTPError,对应相应的状态吗,HTTP状态码表示HTTP协议所返回的响应的状态。下面将状态码归结如下:100:继续客户端应当继续发送请求。客户端应当继续发送请求的剩余部分,或者如果请求已经完成,忽略这个响应。101:转换协议在发送完这个响应最后的空行后,服务器将会切换到在Upgrade消息头中定义的那些协议。只有在切换新的协议更有好处的时候才应该采取类似措施。102:继续处理由WebDAV(RFC251
HTML(Hyper Text Markup Language 超文本标识语言) 是一种用来制作超文本文档的简单标记语言。 用HTML编写的超文本文件称为HTML文件,也称Web文件。 万维网(亦作“Web”、“WWW”、“W3”,英文全称为“World Wide Web”),是一个由许多互相链接的超文本文档组成的系统,通过互联网访问。 在这个系统中,每个有用的事物,称为一样“资源”;并且由一个全域“统一资源标识符”(URI)标识;这些资源通过超文本传输协议(HTTP)传送给使用者,而后者通过点击链接来获得资源。 万维网常被当成互联网的同义词,这是一种误解,万维网是靠着互联网运行的一项服务。
Servlet是Java技术对CGI编程的实现。Servlet程序在服务器端运行,动态地生成Web页面。与传统的CGI和许多其他类似CGI的技术相比,Java Servlet具有更高的效率,更容易使用,功能更强大,具有更好的可移植性,更节省投资。 高效 方便 可移植性好 节省投资
如果某个类要成为Servlet,则它应该从HttpServlet 继承, 根据数据是通过GET还是POST发送,重载doGet、doPost方法之一或全部。 doGet和doPost方法都有两个参数,分别为HttpServletRequest 类型和HttpServletResponse 类型。 HttpServletRequest提供访问有关请求的信息的方法,例如表单数据、HTTP请求头等等。 HttpServletResponse除了提供用于指定HTTP应答状态(200,404等)、应答头(Content-Type,Set-Cookie等)的方法之外,最重要的是它提供了一个用于向客户端发送数据的PrintWriter 。 对于简单的Servlet来说,它的大部分工作是通过println语句生成向客户端发送的页面。 必须导入java.io包(要用到PrintWriter等类)、javax.servlet包(要用到HttpServlet等类)以及javax.servlet.http包(要用到HttpServletRequest类和HttpServletResponse类)。 doGet和doPost这两个方法是由service方法调用的,有时你可能需要直接重载service方法,比如Servlet要处理GET和POST两种请求时
J2EE角色组成开发工具商:提供组件开发工具、应用程序集成工具、应用程序部署工具、界面编辑工具。应用服务器提供商:负责设计和开发J2EE应用服务器(依据J2EE规范)应用开发人员:负责开发组件、写部署描述文件、设计界面(显示数据)应用集成人员:负责将各种界面、组件、描述文件、驱动程序、其他属性文件集成部署人员:负责将J2EE集成文件部署的应用服务器系统管理员:负责调整服务器的运行参数、监视服务器的运行情况J2EE应用开发编写和编译组件代码Servlet,JSP,EJB编写组件的部署描述符把组件装配成可部署的软件包将软件包部署到J2EE应用服务器上开发工具JBuilder商用功能完备EclipseOpenSource插件丰富
LINUX/UNIX简介是一套免费使用和自由传播的类UNIX系统主要基于INTELX86系列CPU的计算机.由全世界各地的成千上万程序员设计和实现.
全称Representational State Transfer(表述性状态移交) 由Roy Fielding在其2000年的博士论文Architectural Styles and the Design of Network-based Software Architectures(架构风格与基于网络应用软件的架构设计)中提出 有两种理解方式 REST是一种抽象的架构风格(architectural style) REST是一种为 面向互联网的应用软件 量身定制的架构风格 REST是Web自身的架构风格,是Web取得巨大成功在技术层面的原因和理论基础 REST在Web上是普适的,同时适用于Web应用和Web API REST是一种分布式应用的架构设计方法
XSS 试讲部分
第1章服务器基础1.1网络服务器概述1.2网络服务器主要技术与指标1.3网络服务器产品介绍1.4网络服务器选型小结习题与思考1.1网络服务器概述 服务器是指在网络环境下运行相应的应用软件,为网上用户提供共享信息资源和各种服务的一种高性能计算机,英文名称叫做Server。 说到服务器,就不得不提客户/服务器(Client/Server)网络计算机模式,如图1.1所示。其中,客户请求服务,服务器处理和提供服务。服务可以是数据库服务、文件服务、检索服务和其他各种各样的应用服务等。服务器包括服务器硬件和服务器软件。