强大的可扩展数据操作与分析Python库:pandas

jopen 11年前

pandas是一个提供快速、可扩展和展现数据结构的Python库。目标是成为成为使用Python处理实践和实际数据分析的模块。并且想成为任何语言都能使用的最强大的可扩展的数据操作与分析开源工具。

主要的特性如下:

  • 为浮点数和与浮点数精度丢失提供了简易的处理方法。
  • 大数据(数字很大,不是通常意义的大数据)的处理。
  • 自动而准确地处理数据队列。
  • 功能强大。
  • 能方便地转换不规则数据和差异数据。
  • 智能地处理大数据集的切片、子集。
  • 智能合并和连接数据集。
  • 灵活地调整数据集。
  • 从CSV、Excel和数据库中导入数据。

相关依赖:

  • NumPy,1.6.1+
  • python-dateuntil,1.5+
  • pytz

推荐的依赖包:

  • numexpr
  • bottleneck

项目主页:http://www.open-open.com/lib/view/home/1394978326587