mysql 驱动
$ sudo pip install MySQL-pythonpython
redis 数据库
$ sudo pip install redismysql
django 全文搜索
$ sudo pip install django-sphinx
git
selenium集成测试工具,配合phantomJS能够模拟浏览器操做
$ sudo pip install seleniumredis
SQLAlchemy 是一个Python 的SQL 工具包以及数据库对象映射框架,示例代码:sql
user1 = User(name='user1')
session.add(user1)
session.commit() 数据库
Flask 是一个微型的 Python 开发的 Web 框架,示例代码:django
from flask import Flask
app = Flask(__name__)flask
@app.route("/")
def hello():
return "Hello World!"浏览器
if __name__ == "__main__":
app.run()网络
BeautifulSoup 库是一个很是神奇的 “粗糙的解析器”,用于解析实际 Web 页面中包含的有效 HTML。
PyQuery (with lxml)
安装方法 pip install pyquery
Python 解析 HTML 时最常常被推荐的是 Beautiful Soup ,并且它的确也表现很好。提供良好的 Python 风格的 API,并且很容易在网上找到相关的资料文档,可是当你须要在短期内解析大量文档时便会碰到性能的问题,简单,可是真的很是慢。
fuzzywuzzy
安装方法:pip install fuzzywuzzy
fuzzywuzzy 能够让你对两个字符串进行模糊比较,当你须要处理一些人类产生的数据时,这很是有用。
sh
安装方法:pip install sh
sh 可以让你调用任意程序,就好象是一个函数通常:
from sh import git, ls, wc
# checkout master branch
git(checkout="master")
# print(the contents of this directory
print(ls("-l"))
# get the longest line of this file
longest_line = wc(__file__, "-L")
pattern
安装方法:pip install pattern
Pattern 是 Python 的一个 Web 数据挖掘模块。可用于数据挖掘、天然语言处理、机器学习和网络分析。