Python检查MySQL数据库表存在并存储/删除库表
2020-02-20 本文已影响0人
继续飘的叶
需要实现的功能
- 新建数据库之前,检查是否已存在
- 新建数据表之前,检查是否已存在
- 测试用的数据库及数据表,在测试完后删除
以下为具体实现
判断数据库存在并创建
使用SqlAlchemy连接MySQL数据库的步骤:
1、创建连接用的url
2、判断该url是否为一个已存在的数据库。若不存在,则应首先创建该数据库。
3、新建连接engine
4、连接数据库
创建连接用的 url
db_url = ‘mysql+pymysql://username:password@localhost:port/db_name
检查数据库是否存在
需要从`sqlalchemy_utils`库中导入`database_exists`和`create_database`
from sqlalchemy_utils import database_exists, create_database`
# 检查数据库是否存在,并创建
if not database_exists(db_url):
create_database(db_url, encoding='utf8')
# 新建连接engine
engine = create_engine(db_url)
# 连接数据库
conn = engine.connect()
判断数据表存在并创建
通过engine的table_names()方法返回当前数据库里所有表名称,从而判断某个数据表table_name是否存在
由于是通过pandas来存储和读取数据表,因此即便表不存在,可以直接用pandas.to_sql
保存,不必提前创建表结构,省去了写sql语句的麻烦。
if table_name not in engine.table_names():
df.to_sql(table_name, con=conn, index=False) # 如果表不存在,则直接保存
若表存在,则最好先检查待存DataFrame的列标签是否与当前表的表头一致。此处需要用到sqlalchemy.inspect
,具体为:
from sqlalchemy import inspect
inspector = inspect(engine)
# 返回某个数据表里的列名
columns_dict_list = inspector(table_name) # 返回的是一个字典的列表,列表中每个元素的’name’键对应该数据表的一个列名
columns = [item[‘name’] for item in columns_dict_list]
比较两组数据表的列名,无误后即可继续使用pandas.to_sql
向已有的数据表添加数据,其中参数if_exists
的值为append
:
if df_columns == columns: # df_columns是待存储DataFrame的列名列表
df.to_sql(table_name, con=conn, if_exists=‘append’)
删除测试时添加的数据库表
笔者目前没有在sqlalchemy中找到删除数据库表的方法,所以只能使用sqlalchemy_utils
库的drop_database
来删除数据库,使用pymysql
库及sql语句来删除数据表。
删除数据表
import pymysql
# 使用pymysql建立与数据库的连接:
pymysql_conn = pymysql.connect(‘localhost, username, password, db_name, charset=‘utf8’)
# 删除数据表的sql语句:
drop_table_sql = ‘drop table %s’ %table_name
cursor = pymysql_conn.cursor()
cursor.execute(drop_table_sql)
pymysql_conn.close()
删除数据库
from sqlalchemy_utils import drop_database
drop_database(db_url) # db_url是通过sqlalchemy连接数据库所使用的url