Python实现数据库与Excel文件之间的数据导入与导出

07-14 1140阅读

数据库和Excel文件是两种常见且重要的数据存储方式。数据库通常用于大规模数据的高效存储、管理和查询,而Excel则以其直观的界面和简单的操作方式广泛应用于数据分析、报告生成和可视化等领域。在实际工作中,可能需要在这两者之间进行数据的导入与导出。例如,从数据库中提取数据到Excel进行深入分析和图表绘制,或者将Excel文件中的数据清洗整理后导入数据库进行集中管理和进一步处理。而Python因其便捷性和丰富的生态,能够帮助用户通过简单的代码处理数据库与Excel文件之间数据转换。

本文将介绍如何使用Python有效地实现数据库与Excel文件之间的数据自动化导入与导出,以SQLite数据库为例。

文章目录

    • 用Python将数据库数据导出到Excel表格
    • 用Python将Excel表格数据导入到数据库

      本文所使用的方法需要用到sqlite3(Python标准库中的组件)和Spire.XLS for Python(PyPI: pip install Spire.XLS)。

      用Python将数据库数据导出到Excel表格

      我们可以使用 sqlite3 模块从数据库读取数据,并利用 Spire.XLS 模块创建 Excel 文件并将数据写入其中,从而实现数据库数据的导出。详细步骤如下:

      1. 导入必要的模块。
      2. 连接数据库:使用 sqlite3.connect() 连接 SQLite 数据库,并创建游标 cursor 执行 SQL 命令。
      3. 获取表名:执行 SQL 查询获取数据库中所有表的名称,并存储在 tableNames 列表中。
      4. 创建 Excel 工作簿:初始化一个 Workbook 对象,并使用 Workbook.Worksheets.Clear() 方法清除默认工作表。
      5. 遍历数据库表:对于 tableNames 中的每一个表名:
        • 查询表的列信息,提取列名并添加到 columnNames 列表中。
        • 获取表中的所有数据行到 rows 中。
        • 使用 Workbook.Worksheets.Add(sheetname) 方法在 Excel 中添加一个以表名命名的新工作表。
        • 使用 Worksheet.Range[row, col].Value 属性将 columnNames 作为标题写入工作表。
        • 遍历数据行,并使用相同的属性将数据写入对应的单元格。
        • 格式化工作表。
        • 使用 Workbook.SaveToFile() 方法将工作簿保存到文件。
        • 释放 workbook 的资源并关闭数据库连接。

      代码示例

      from spire.xls import *
      from spire.xls.common import *
      import sqlite3
      # 连接到数据库
      conn = sqlite3.connect("output/CompanyInfo.db")
      cursor = conn.cursor()
      # 获取数据库中所有的表名
      cursor.execute("SELECT name FROM sqlite_master WHERE type='table';")
      tableNames = [name[0] for name in cursor.fetchall()]
      # 创建 Excel 文件
      workbook = Workbook()
      workbook.Worksheets.Clear()
      # 遍历数据库中的每个表
      for tableName in tableNames:
          # 获取表的列名
          cursor.execute(f"PRAGMA table_info('{tableName}')")
          columnsInfo = cursor.fetchall()
          columnNames = [columnInfo[1] for columnInfo in columnsInfo]
          # 获取表的数据
          cursor.execute(f"SELECT * FROM {tableName}")
          rows = cursor.fetchall()
          
          # 创建工作表
          sheet = workbook.Worksheets.Add(tableName)
          
          # 将标题行写入工作表
          for i in range(len(columnNames)):
              sheet.Range[1, i + 1].Value = columnNames[i]
          
          # 将数据写入工作表
          for j in range(1, len(rows)):
              column = rows[j]
              for k in range(len(column)):
                  sheet.Range[j + 1, k + 1].Value = column[k]
          
          # 设置工作表格式
          sheet.AllocatedRange.Style.Font.FontName = "Times New Roman"
          sheet.AllocatedRange.Style.Font.Size = 12.0
          sheet.AllocatedRange.AutoFitRows()
          sheet.AllocatedRange.AutoFitColumns()
      # 保存 Excel 文件
      workbook.SaveToFile("output/DatabaseToExcel.xlsx", FileFormat.Version2016)
      workbook.Dispose()
      conn.close()
      

      结果

      Python实现数据库与Excel文件之间的数据导入与导出

      用Python将Excel表格数据导入到数据库

      我们也可以使用 Spire.XLS 从 Excel 文件读取各种数据类型,然后使用 sqlite3 将数据写入数据库。详细步骤如下:

      1. 导入必要的模块。
      2. 创建 Workbook 实例:初始化一个 Workbook 对象以操作 Excel 工作簿。
      3. 加载 Excel 文件:使用 LoadFromFile 方法从指定路径加载 Excel 文件。
      4. 连接数据库:使用 sqlite3.connect() 连接 SQLite 数据库,并创建游标 cursor 执行 SQL 命令。
      5. 遍历工作表:对于工作簿中的每个工作表:
        • 使用 Worksheet.Name 属性获取工作表对象和名称,并去除名称中的空格。
        • 提取标题:使用 Worksheet.Range[row, col].Value 属性收集第一行数据作为数据库表的列名,并去除空格。
        • 创建数据库表:基于提取的标题动态生成 SQL 语句以创建表(如果不存在)。
        • 插入数据:遍历工作表的每一行,使用 Worksheet.Range[row, col].Value 属性收集数据,然后构造 SQL 插入语句将数据插入相应的数据库表。
        • 提交并关闭数据库连接:将所有更改提交到数据库并关闭数据库连接。
        • 释放 Workbook 资源:清理 Workbook 对象所使用的资源。

      代码示例

      from spire.xls import *
      from spire.xls.common import *
      import sqlite3
      # 创建 Workbook 实例
      workbook = Workbook()
      # 加载 Excel 文件
      workbook.LoadFromFile("Sample.xlsx")
      # 连接到数据库
      conn = sqlite3.connect("output/ExcelToDatabase.db")
      cursor = conn.cursor()
      for s in range(workbook.Worksheets.Count):
          # 获取一个工作表
          sheet = workbook.Worksheets.get_Item(s)
          # 获取工作表名称
          sheetName = sheet.Name
          sheetName = sheetName.replace(" ", "")
          # 获取标题行中的数据
          header = []
          for i in range(sheet.AllocatedRange.ColumnCount):
              headerValue = sheet.Range[1, i + 1].Value
              headerValue = headerValue.replace(" ", "")
              header.append(headerValue)
          # 创建数据库表
          createTableSql = f"CREATE TABLE IF NOT EXISTS {sheetName} ({', '.join([f'{header[i]} TEXT' for i in range(len(header))])})"
          cursor.execute(createTableSql)
          # 插入数据到数据库表中
          for row in range(1, sheet.AllocatedRange.RowCount):
              data = []
              for col in range(sheet.AllocatedRange.ColumnCount):
                  # 获取单元格值
                  value = sheet.Range[row + 1, col + 1].Value
                  data.append(value)
              # 插入单元格值到数据库表中
              insertSql = f"INSERT INTO {sheetName} ({', '.join(header)}) VALUES ({', '.join(['?' for _ in data])})"
              cursor.execute(insertSql, data)
      # 提交更改并关闭连接
      conn.commit()
      conn.close()
      workbook.Dispose()
      

      结果

      Python实现数据库与Excel文件之间的数据导入与导出

      本文展示了如何使用 Python 代码在 Excel 工作簿和数据库之间进行数据的导入与导出。

      有关更多 Excel 文件处理技巧,请访问 Spire.XLS for Python教程。

VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]