python 不得不知的第三方库以及经常使用安装包

mysql 驱动
$ sudo pip install MySQL-pythonpython

 

redis 数据库
$ sudo pip install redismysql

 

django 全文搜索
$ sudo pip install django-sphinx
git

 

selenium集成测试工具,配合phantomJS能够模拟浏览器操做
$ sudo pip install selenium
redis

 

SQLAlchemy 是一个Python 的SQL 工具包以及数据库对象映射框架,示例代码:sql

user1 = User(name='user1')
session.add(user1)

session.commit() 数据库

 

Flask 是一个微型的 Python 开发的 Web 框架,示例代码:django

from flask import Flask
app = Flask(__name__)flask

@app.route("/")
def hello():
    return "Hello World!"浏览器

if __name__ == "__main__":
    app.run()网络

 

 

BeautifulSoup 库是一个很是神奇的 “粗糙的解析器”,用于解析实际 Web 页面中包含的有效 HTML。

 

 

PyQuery (with lxml)

安装方法 pip install pyquery

Python 解析 HTML 时最常常被推荐的是 Beautiful Soup ,并且它的确也表现很好。提供良好的 Python 风格的 API,并且很容易在网上找到相关的资料文档,可是当你须要在短期内解析大量文档时便会碰到性能的问题,简单,可是真的很是慢。

 

 

fuzzywuzzy

安装方法:pip install fuzzywuzzy

fuzzywuzzy 能够让你对两个字符串进行模糊比较,当你须要处理一些人类产生的数据时,这很是有用。

 

 

sh

安装方法:pip install sh

sh 可以让你调用任意程序,就好象是一个函数通常:

from sh import git, ls, wc

# checkout master branch
git(checkout="master")

# print(the contents of this directory
print(ls("-l"))

# get the longest line of this file
longest_line = wc(__file__, "-L")

 

 

pattern

安装方法:pip install pattern

Pattern 是 Python 的一个 Web 数据挖掘模块。可用于数据挖掘、天然语言处理、机器学习和网络分析。

相关文章
相关标签/搜索