python学习--SQLAlchemy
ORM
ORM,对象关系映射,对象和关系之间的映射,使用面向对象的方式来操作数据库
关系模型和Python对象之间的映射
table => class ,表映射为类
row => object ,行映射为实例
column => property ,字段映射为属性
SQLAlchemy
安装
$ pip install sqlalchemy
文档
官方文档 http://docs.sqlalchemy.org/en/latest/
查看版本
import sqlalchemy
print(sqlalchemy.__version__)
开发
SQLAlchemy内部使用了连接池
创建连接
数据库连接的事情,交给引擎
from sqlalchemy import create_engine
dialect+driver://username:[email protected]:port/database
mysqldb的连接
mysql+mysqldb://<user>:<password>@<host>[:<port>]/<dbname>
engine = sqlalchemy.create_engine("mysql+mysqldb://test:[email protected]:3306/test")
pymysql的连接
mysql+pymysql://<username>:<password>@<host>/<dbname>[?<options>]
engine = sqlalchemy.create_engine("mysql+pymysql://test:[email protected]:3306/test")
engine = sqlalchemy.create_engine("mysql+pymysql://test:[email protected]:3306/test",
echo=True)
echo=True
引擎是否打印执行的语句,调试的时候打开很方便。
lazy connecting:懒连接。创建引擎并不会马上连接数据库,直到让数据库执行任务时才连接。
Declare a Mapping创建映射
创建基类
from sqlalchemy.ext.declarative import declarative_base
# 创建基类,便于实体类继承。SQLAlchemy大量使用了元编程
Base = declarative_base() # 内部实现描述器
创建实体类
student表
CREATE TABLE student (
id INTEGER NOT NULL AUTO_INCREMENT,
name VARCHAR(64) NOT NULL,
age INTEGER,
PRIMARY KEY (id)
)
from sqlalchemy import Column, Integer, String
# 创建实体类
class Student(Base):
# 指定表名
__tablename__ = 'student'
# 定义类属性对应字段
id = Column(Integer, primary_key=True, autoincrement=True)
name = Column(String(64), nullable=False)
age = Column(Integer)
# 第一参数是字段名,如果和属性名不一致,一定要指定
# 例如:a = Column('age', Integer)
def __repr__(self):
return "{} id={} name={} age={}".format(
self.__class__.__name__, self.id, self.name, self.age)
# 查看表结构
print(Student)
print(repr(Student.__table__))
# 显示结果
Table('student', MetaData(bind=None),
Column('id', Integer(), table=<student>, primary_key=True, nullable=False),
Column('name', String(length=64), table=<student>, nullable=False),
Column('age', Integer(), table=<student>),
schema=None)
__tablename__
指定表名
Column类指定对应的字段,必须指定, 第一参数是字段名, 如果和属性名一致, 则不需要传参
实例化
s = Student(name='tom')
print(s.name)
s.age = 20
print(s.age)
创建表
可以使用SQLAlchemy来创建、删除表
# 删除继承自Base的所有表
Base.metadata.drop_all(engine)
# 创建继承自Base的所有表
Base.metadata.create_all(engine)
生产环境很少这样创建表,都是系统上线的时候由脚本生成。
生产环境很少删除表,宁可废弃都不能删除
创建会话session
在一个会话中操作数据库,会话建立在连接上,连接被引擎管理。
当第一次使用数据库时,从引擎维护的连接池中获取一个连接使用
# 创建session
from sqlalchemy.orm import sessionmaker
from sqlalchemy.orm.session import Session
# Session = sessionmaker(bind=engine) # 工厂方法返回类
session:Session = sessionmaker(bind=engine)() # 实例化
# 依然在第一次使用时连接数据库
session对象线程不安全。所以不同线程应该使用不用的session对象。
Session类和engine有一个就行了
CRUD操作
增
add():增加一个对象
add_all():可迭代对象,元素是对象
import sqlalchemy
from sqlalchemy import create_engine, Column, String, Integer
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker
# mysql+pymysql://<username>:<password>@<host>/<dbname>[?<options>]
IP = "127.0.0.1" # IP
USERNAME = "test" # 用户名称
PASSWORD = "test" # 用户密码
DBNAME = "test" # 数据库名称
PORT = 3306 # 端口
# 用户名称, 密码, IP, 端口, 数据库名称
# 创建引擎
engine = create_engine("mysql+pymysql://{}:{}@{}:{}/{}".format(
USERNAME, PASSWORD, IP, PORT, DBNAME
),echo=True) # lazy 懒连接
# Base.metadata.drop_all(engine) # 删除Base管理的所有类对应的表
# Base.metadata.create_all(engine) # 创建Base管理的所有类对应的表
###########################################
# ORM Mapping 创建映射
Base = declarative_base() # 基类
# 内部实现描述器
class Student(Base):
__tablename__ = "student" # 表名称
# 定义字段类型和属性
id = Column(Integer, primary_key=True, autoincrement=True) # 第一个写字段名, 如果字段名和属性名相同, 则省略不写
name = Column(String(64), nullable=False)
age = Column(Integer)
def __repr__(self):
return "<{} id={}, name={}, age={}>".format(
__class__.__name__, self.id, self.name, self.age
)
# 创建会话
from sqlalchemy.orm.session import Session
# Session = sessionmaker(bind=engine) # 绑定engine, 工厂方法返回类
session:Session = sessionmaker(bind=engine)() # 线程不安全
#########################
student = Student(name="tom", age="22")
session.add(student) # 添加数据
session.commit() # 提交数据
try:
session.add_all([student])
session.commit() # 提交能成功吗?
print("---------------")
except:
session.rollback() # 回滚数据
print("````````````")
add_all()方法不会提交成功的,不是因为它不对,而是student成功提交后,student的主键就有了值,所以,只要student没有修改过,就认为没有改动。如下,student变化了,就可以提交修改了
student.name = 'jerry' # 修改
session.add_all([student])
student主键没有值,就是新增;主键有值,就是找到主键对应的记录修改
简单查询
使用query()方法,返回一个Query对象
students = session.query(Student) # 无条件
print(students) # 无内容,惰性的
for student in students:
print(student)
print('~~~~~~~~~~~~~')
student = session.query(Student).get(2) # 通过主键查询
print(student)
query方法将实体类传入,返回类的对象可迭代对象,这时候并不查询。迭代它就执行SQL来查询数据库,封装数据到指定类的实例。
get方法使用主键查询,返回一条传入类的一个实例
改
student = session.query(Student).get(2)
print(student)
student.name = 'sam'
student.age = 30
print(student)
session.add(student)
session.commit()
先查回来, 修改后,在提交更改
删除
student = session.query(Student).get(4)
print(student)
session.delete(student)
session.commit()
先查回来, 删除后, 在提交更改
状态
每一个实体,都有一个状态属性_sa_instance_state,其类型是sqlalchemy.orm.state.InstanceState,可以使用sqlalchemy.inspect(entity)函数查看状态。
常见的状态值有transient、pending、persistent、deleted、detached
状态 | 说明 |
---|---|
transient | 实体类尚未加入到session中,同时并没有保存到数据库中 |
pending | transient的实体被add()到session中,状态切换到pending,但它还没有flush到数据库中 |
persistent | session中的实体对象对应着数据库中的真实记录。pending状态在提交成功后可以变成persistent状态,或者查询成功返回的实体也是persistent状态 |
deleted | 实体被删除且已经flush但未commit完成。事务提交成功了,实体变成detached,事务失败,返回persistent状态 |
detached | 删除成功的实体进入这个状态 |
新建一个实体,状态是transient临时的。
一旦add()后从transient变成pending状态。
成功commit()后从pending变成persistent状态。
成功查询返回的实体对象,也是persistent状态。
persistent状态的实体,修改依然是persistent状态。
persistent状态的实体,删除后,flush后但没有commit,就变成deteled状态,成功提交,变为detached状态, 提交失败,还原到persistent状态。flush方法,主动把改变应用到数据库中去。
删除、修改操作,需要对应一个真实的记录,所以要求实体对象是persistent状态
import sqlalchemy
from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker
connstr = "{}://{}:{}@{}:{}/{}".format(
'mysql+pymysql', 'test', 'test',
'127.0.0.1', 3306, 'test'
)
engine = create_engine(connstr, echo=True)
Base = declarative_base()
# 创建实体类
class Student(Base):
# 指定表名
__tablename__ = 'student'
# 定义属性对应字段
id = Column(Integer, primary_key=True, autoincrement=True)
name = Column(String(64), nullable=False)
age = Column(Integer)
# 第一参数是字段名,如果和属性名不一致,则一定要指定
# age = Column('age', Integer)
def __repr__(self):
return "{} id={} name={} age={}".format(
self.__class__.__name__, self.id, self.name, self.age)
Session = sessionmaker(bind=engine)
session = Session()
from sqlalchemy.orm.state import InstanceState
def getstate(instance, i):
inp:InstanceState = sqlalchemy.inspect(student)
states = "{}: key={}\nsid={}, attached={}, transient={}, " \
"pending={}, \npersistent={}, deleted={}, detached={}".format(
i, inp.key,
inp.session_id, inp._attached, inp.transient,
inp.pending, inp.persistent, inp.deleted, inp.detached
)
print(states, end='\n------------------------\n')
student = session.query(Student).get(2)
getstate(student, 1) # persistent
try:
student = Student(id=2, name='sam', age=30)
getstate(student, 2) # transit
student = Student(name='sammy', age=30)
getstate(student, 3) # transient
session.add(student) # add后变成pending
getstate(student, 4) # pending
# session.delete(student) # 异常,删除的前提必须是persistent,也就是说先查后删
# getstate(student, 5)
session.commit() # 提交后,变成persistent
getstate(student, 6) # persistent
except Exception as e:
session.rollback()
print(e, '~~~~~~~~~~~~~~~~')
# 运行结果
1: key=(<class '__main__.Student'>, (2,), None)
sid=1, attached=True, transient=False, pending=False,
persistent=True, deleted=False, detached=False
persistent就是key不为None,附加的,且不是删除的,有sessionid
------------------------
2: key=None
sid=None, attached=False, transient=True, pending=False,
persistent=False, deleted=False, detached=False
transient的key为None,且无附加
------------------------
3: key=None
sid=None, attached=False, transient=True, pending=False,
persistent=False, deleted=False, detached=False
同上
------------------------------
4: key=None
sid=1, attached=True, transient=False, pending=True,
persistent=False, deleted=False, detached=False
add后变成pending,已附加,但是没有key,有了sessionid
------------------------------
sqlalchemy.engine.base.Engine COMMIT
6: key=(<class '__main__.Student'>, (3,), None)
sid=1, attached=True, transient=False, pending=False,
persistent=True, deleted=False, detached=False
提交成功后,变成persistent,有了key
------------------------------
student = session.query(Student).get(5)
getstate(student, 10) # persistent
try:
session.delete(student) # 删除的前提是persistent
getstate(student, 11) # persistent
session.flush()
getstate(student, 12) # deleted
session.commit()
getstate(student, 13) # detached
except Exception as e:
session.rollback()
print('~~~~~~~~')
print(e)
# 运行结果
10: key=(<class '__main__.Student'>, (5,), None)
sid=1, attached=True, transient=False, pending=False,
persistent=True, deleted=False, detached=False
------------------------
11: key=(<class '__main__.Student'>, (5,), None)
sid=1, attached=True, transient=False, pending=False,
persistent=True, deleted=False, detached=False
------------------------
sqlalchemy.engine.base.Engine DELETE FROM student WHERE student.id = %(id)s
sqlalchemy.engine.base.Engine {'id': 5}
12: key=(<class '__main__.Student'>, (5,), None)
sid=1, attached=True, transient=False, pending=False,
persistent=False, deleted=True, detached=False
delete后flush,状态变成deleted,不过是附加的
------------------------------
sqlalchemy.engine.base.Engine COMMIT
一旦提交后
13: key=(<class '__main__.Student'>, (5,), None)
sid=None, attached=False, transient=False, pending=False,
persistent=False, deleted=False, detached=True
状态转为detached
------------------------------
复杂查询
from sqlalchemy import create_engine, Column, Integer, String, Enum, Date
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker
import enum
USERNAME = "test"
PASSWORD = "test"
IP = "127.0.0.1"
PORT = 3306
DBNAME = "test"
engine = create_engine("mysql+pymysql://{}:{}@{}:{}/{}".format(
USERNAME, PASSWORD, IP, PORT, DBNAME), echo=True)
class Gender(enum.Enum):
M = "M"
F = "F"
Base = declarative_base()
class Employees(Base):
# 指定表名
__tablename__ = "employees"
emp_no = Column(Integer, primary_key=True)
birth_date = Column(Date, nullable=False)
first_name = Column(String(14), nullable=False)
last_name = Column(String(16), nullable=False)
gender = Column(Enum(Gender), nullable=False)
hire_date = Column(Date, nullable=False)
def __repr__(self):
return "{} no={}, name={} {}, gender={}".format(
__class__.__name__, self.emp_no, self.first_name, self.last_name,
self.gender.value
)
# Base.metadata.drop_all(engine)
# Base.metadata.create_all(engine)
from sqlalchemy.orm.session import Session
session:Session = sessionmaker(bind=engine)()
# 打印函数
def show(emps):
for x in emps:
print(x)
print("------------\n")
# 简单条件查询
emps = session.query(Employees).filter(Employees.emp_no > 10015)
show(emps)
# 与或非
from sqlalchemy import or_, and_, not_
# AND条件
emps = session.query(Employees).filter(Employees.emp_no > 10015).filter(Employees.gender == Gender.F)
show(emps)
emps = session.query(Employees).filter(Employees.emp_no > 10015, Employees.emp_no < 10018)
show(emps)
emps = session.query(Employees).filter(and_(Employees.emp_no > 10015, Employees.gender == Gender.F))
show(emps)
emps = session.query(Employees).filter((Employees.emp_no > 10015) & (Employees.gender == Gender.M))
show(emps) # & 一定要注意&符号两边表达式都要加括号
# OR 条件
emps = session.query(Employees).filter((Employees.emp_no > 10018) | (Employees.emp_no < 10003))
show(emps)
emps = session.query(Employees).filter(or_(Employees.emp_no > 10018, Employees.emp_no < 10003))
show(emps)
# NOT
emps = session.query(Employees).filter(not_(Employees.emp_no < 10018))
show(emps)
# 一定注意加括号
emps = session.query(Employees).filter(~(Employees.emp_no < 10018))
show(emps)
# 总之,与或非的运算符&、|、~,一定要在表达式上加上括号
# in
emplist = [10010, 10015, 10018]
emps = session.query(Employees).filter(Employees.emp_no.in_(emplist))
show(emps)
# not in
emps = session.query(Employees).filter(~Employees.emp_no.in_(emplist))
show(emps)
emps = session.query(Employees).filter(Employees.emp_no.notin_(emplist))
show(emps)
# like
emps = session.query(Employees).filter(Employees.last_name.like("P%"))
show(emps)
# not like
emps = session.query(Employees).filter(Employees.last_name.notlike("P%"))
show(emps)
# ilike可以忽略大小写匹配
排序
# 排序
# 升序
emps = session.query(Employee).filter(Employee.emp_no > 10010).order_by(Employee.emp_no)
emps = session.query(Employee).filter(Employee.emp_no > 10010).order_by(Employee.emp_no.asc())
show(emps)
# 降序
emps = session.query(Employee).filter(Employee.emp_no > 10010).order_by(Employee.emp_no.desc())
show(emps)
# 多列排序
emps = session.query(Employee).filter(Employee.emp_no >10010).order_by(Employee.last_name).order_by(Employee.emp_no.desc())
show(emps)
分页
# 分页
emps = session.query(Employee).limit(4)
show(emps)
emps = session.query(Employee).limit(4).offset(18)
show(emps)
消费者方法
消费者方法调用后,Query对象(可迭代)就转换成了一个容器
# 总行数
emps = session.query(Employee)
print(len(list(emps))) # 查询得到结果集,转成list,然后取长度
print(emps.count()) # 聚合函数count(*)的查询
# 取所有数据
print(emps.all()) # 返回列表,查不到返回空列表
# 取首行
print(emps.first()) # 返回首行,查不到返回None,等价limit
# 有且只能有一行
#print(emps.one()) #如果查询结果是多行抛异常
print(emps.limit(1).one())
# 删除 delete by query
session.query(Employee).filter(Employee.emp_no > 10018).delete()
#session.commit() # 提交则删除
first方法本质上就是limit语句
聚合, 分组
# 聚合函数
# count
from sqlalchemy import func
query = session.query(func.count(Employee.emp_no))
print(query.all()) # 列表中一个元素
print(query.first()) # 一个只有一个元素的元组
print(query.one()) # 只能有一行返回,一个元组
print(query.scalar()) # 取one()的第一个元素
# max/min/avg
print(session.query(func.max(Employee.emp_no)).scalar())
print(session.query(func.min(Employee.emp_no)).scalar())
print(session.query(func.avg(Employee.emp_no)).scalar())
# 分组
query = session.query(Employee.gender,
func.count(Employee.emp_no)).group_by(Employee.gender).all()
for g,y in query:
print(g.value, y)
级联查询
1, 隐式内连接
# 查询10010员工的所在的部门编号及员工信息
results = session.query(Employee, Dept_emp).filter(Employee.emp_no ==Dept_emp.emp_no).filter(Employee.emp_no == 10010).all()
show(results)
# 查询结果2行
(Employee no=10010 name=Duangkaew Piveteau gender=F, Dept_emp empno=10010 deptno=d004)
(Employee no=10010 name=Duangkaew Piveteau gender=F, Dept_emp empno=10010 deptno=d006)
2, 使用join
sqlalchemy.orm.relationship(实体类名字符串)在本表内调用另一张表
只要不访问departments属性,就不会查作为参数传入的这张表
# 查询10010员工的所在的部门编号及员工信息
# 第一种
results = session.query(Employee).join(Dept_emp).filter(Employee.emp_no ==Dept_emp.emp_no).filter(Employee.emp_no == 10010)
# 第二种
results = session.query(Employee).join(Dept_emp, Employee.emp_no ==Dept_emp.emp_no).filter(Employee.emp_no == 10010)
# 第三种
results = session.query(Employee).join(Dept_emp, (Employee.emp_no == Dept_emp.emp_no) &(Employee.emp_no == 10010))
show(results.all()) # 打印结果
第一种方法join(Dept_emp)中没有等值条件,会自动生成一个等值条件,如果后面有filter,哪怕是filter(Employee.emp_no ==Dept_emp.emp_no),这个条件会在where中出现。第一种这种自动增加join的等值条件的方式不好,不要这么写
第二种方法在join中增加等值条件,阻止了自动的等值条件的生成。这种方式推荐
第三种方法就是第二种,这种方式也可以
总结
在开发中,一般都会采用ORM框架,这样就可以使用对象操作表了。
定义表映射的类,使用Column的描述器定义类属性,使用ForeignKey来定义外键约束。
如果在一个对象中,想查看其它表对应的对象的内容,就要使用relationship来定义关系。
是否使用外键约束?
1、力挺派
能使数据保证完整性一致性
2、弃用派
开发难度增加,大量数据的时候影响插入、修改、删除的效率。
在业务层保证数据的一致性
上一篇: [模板题][双指针]数组元素的目标和
下一篇: java中List对象排序通用方法