我一直在探索如何让python快速地检索数据,除了把数据装在py文件里,一起打包之外,我还尝试过把数据放到json文件里或csv文件里,这样就可以快速地检索到我们想要的数据。考虑到检索数据库sql格式的文件,我还没有做过,今天就请出deepseek,让它来帮我把我的数据转化为一个sql文件,然后用python生成一个tkinter框架的ui界面,结果发现查询速度飞快。以下的工具的截图。
一、功能介绍
这个工具,可以快速地读取指定的sql格式文件,找到单词的多个变形,或者输入变形来查找它的原形。其主要特别是检索速度快,图形界面,多个检索模式。采用数据库来存储文件。
二、制作过程
1. 收集数据,明确任务
找到en_lemma.py格式的文件,把里面存储的数据写入到xlsx当中。文件内容如下:
en_lemma.py内容
我请deepseek为我生成了一段代码如下:
from openpyxl import workbook from en_lemma import lemmas # 导入字典数据 # 创建新工作簿并获取活动工作表 wb = workbook() ws = wb.active # 遍历字典的键值对 for key, values in lemmas.items(): # 构造行数据:键作为第一列,后面接列表元素 row_data = [key] + values # 将数据写入工作表 ws.append(row_data) # 保存excel文件 wb.save("lemmas_data.xlsx")
2. 修改xlsx文件,生成sql数据库
我们利用python中的pandas包和sqlite3包把这个lemmas_data.xlsx转化为sql数据库,代码如下:
import pandas as pd import sqlite3 # 1. 读取 excel 文件 excel_file = "en_lemmas.xlsx" # excel 文件路径 sheet_name = "sheet1" # excel 工作表名称 df = pd.read_excel(excel_file, sheet_name=sheet_name) # 2. 创建 sqlite 数据库 sqlite_db = "verb_forms.db" # sqlite 数据库文件路径 conn = sqlite3.connect(sqlite_db) cursor = conn.cursor() # 3. 创建表 create_table_query = """ create table if not exists verb_forms ( id integer primary key autoincrement, base_form text not null, variant text not null ); """ cursor.execute(create_table_query) # 4. 将数据插入 sqlite 表 for index, row in df.iterrows(): base_form = row["baseform"] # 假设 a 列是 baseform # 遍历 b、c、d 列(variant1, variant2, variant3) for col in ["variant1", "variant2", "variant3", "variant4", "variant5", "variant6"]: variant = row[col] # 检查是否为有效值(非空) if pd.notna(variant) and variant.strip() != "": # 使用参数化查询避免 sql 注入和特殊字符问题 insert_query = """ insert into verb_forms (base_form, variant) values (?, ?); """ cursor.execute(insert_query, (base_form, variant.strip())) # 5. 提交更改并关闭连接 conn.commit() conn.close() print(f"数据已成功导入 sqlite 数据库: {sqlite_db}")
代码使用前,要把lemmas_data.xlsx文件打开,在首行插入一行,为每一列增加标题。第一列为baseform,第二列为variant1,第二列为variant2,依次类推。然后再改名为en_lemmas.xlsx后,再运行上述代码。
en_lemmas.xlsx文件内容
3. 使用tkinter,编写检索界面
采用deepseek编写一个ui界面的检索软件,可视化呈现检索结果。编写前先在非可视化界面下测试软件,于时我们得到一个简单的检索代码:
import sqlite3 def get_base_form(word_to_find: str) -> str: try: # 连接数据库(自动处理相对路径) with sqlite3.connect("verb_forms.db") as conn: cursor = conn.cursor() # 参数化查询防止 sql 注入 cursor.execute( "select base_form from verb_forms where variant = ?", (word_to_find,) ) result = cursor.fetchone() return result[0] if result else "" # 关键修复:去掉括号 except sqlite3.error as e: print(f"数据库错误:{e}") return "" # 测试代码 if __name__ == "__main__": test_word = "thought" base_form = get_base_form(test_word) if base_form: print(f"单词 '{test_word}' 的基本形式是:{base_form}") else: print(f"未找到 '{test_word}' 的基本形式")
然后,根据这个检索代码,进一步扩展,添加ui界面,最终得到以下代码:
import sqlite3 import tkinter as tk from tkinter import ttk from tkinter import messagebox def get_base_form(word_to_find: str) -> str: try: # 连接数据库(自动处理相对路径) with sqlite3.connect("verb_forms.db") as conn: cursor = conn.cursor() # 参数化查询防止 sql 注入 cursor.execute( "select base_form from verb_forms where variant = ?", (word_to_find,) ) result = cursor.fetchone() return result[0] if result else "" except sqlite3.error as e: messagebox.showerror(" 数据库错误", f"数据库错误:{e}") return "" def get_variants(word_to_find: str) -> list: try: with sqlite3.connect("verb_forms.db") as conn: cursor = conn.cursor() # 先验证输入的是否为有效原形 cursor.execute("select base_form from verb_forms where base_form = ?", (word_to_find,)) if not cursor.fetchone(): return [] # 不是有效原形则直接返回空 # 查询变形 cursor.execute("select variant from verb_forms where base_form = ?", (word_to_find,)) return [row[0] for row in cursor.fetchall()] except sqlite3.error as e: messagebox.showerror(" 数据库错误", f"数据库错误:{e}") return [] def query(): word = entry.get() if choice.get() == 1: base_form = get_base_form(word) if base_form: result_text.delete(1.0, tk.end) result_text.insert(tk.end, f"单词【{word}】的基本形式是:{base_form}") else: result_text.delete(1.0, tk.end) result_text.insert(tk.end, f"未找到【{word}】的基本形式") elif choice.get() == 2: variants = get_variants(word) result_text.delete(1.0, tk.end) if variants: # 显示变形列表 result_text.insert(tk.end, f"原形【{word}】的变形:\n" + ", ".join(variants)) else: # 分情况提示 try: with sqlite3.connect("verb_forms.db") as conn: cursor = conn.cursor() cursor.execute("select base_form from verb_forms where variant = ?", (word,)) if cursor.fetchone(): result_text.insert(tk.end, f"注意:您输入的是变形单词,请切换至「原形」模式查询") else: result_text.insert(tk.end, f"数据库未收录【{word}】的相关变形") except sqlite3.error as e: messagebox.showerror(" 数据库错误", f"数据库错误:{e}") def copy_text(): result_text.clipboard_clear() result_text.clipboard_append(result_text.selection_get()) def cut_text(): copy_text() result_text.delete(tk.sel_first, tk.sel_last) def paste_text(): result_text.insert(tk.insert, result_text.clipboard_get()) def entry_copy(): try: # 获取 entry 选中内容并复制 entry.clipboard_clear() entry.clipboard_append(entry.selection_get()) except tk.tclerror: pass # 无选中内容时不操作 def entry_cut(): entry_copy() # 先复制 try: entry.delete(tk.sel_first, tk.sel_last) # 再删除选中内容 except tk.tclerror: pass def entry_paste(): entry.insert(tk.insert, entry.clipboard_get()) # 插入剪贴板内容 # 创建主窗口 root = tk.tk() root.title(" 单词查询") # 设置所有标准控件的默认字体 root.option_add("*font", ("times new roman", 14)) # 影响 entry、button 等非 ttk 控件 # 设置 ttk 控件的主题字体 style = ttk.style() style.configure(".", font=("times new roman", 14)) # 通配符 . 表示所有 ttk 控件 # 创建输入框、单选按钮和查询按钮 frame_top = ttk.frame(root) frame_top.pack(pady=10) entry = ttk.entry(frame_top, width=20) entry.pack(side=tk.left, padx=5) entry.bind("<return>", lambda event: query()) # 按回车触发查询 entry.focus_set() # 创建 entry 的右键菜单 entry_menu = tk.menu(entry, tearoff=0) entry_menu.add_command(label=" 剪切", command=entry_cut) entry_menu.add_command(label=" 复制", command=entry_copy) entry_menu.add_command(label=" 粘贴", command=entry_paste) def show_entry_menu(event): entry_menu.post(event.x_root, event.y_root) # 显示菜单 entry.bind("<button-3>", show_entry_menu) # 绑定右键事件 choice = tk.intvar() choice.set(2) radio1 = ttk.radiobutton(frame_top, text="原形", variable=choice, value=1) radio1.pack(side=tk.left, padx=5) radio2 = ttk.radiobutton(frame_top, text="变形", variable=choice, value=2) radio2.pack(side=tk.left, padx=5) query_button = ttk.button(frame_top, text="查询", command=query) query_button.pack(side=tk.left, padx=5) # 创建结果显示文本框 result_text = tk.text(root, height=10, width=60) result_text.pack(pady=10) # 创建右键菜单 menu = tk.menu(result_text, tearoff=0) menu.add_command(label=" 复制", command=copy_text) menu.add_command(label=" 剪切", command=cut_text) menu.add_command(label=" 粘贴", command=paste_text) def show_menu(event): menu.post(event.x_root, event.y_root) result_text.bind("<button-3>", show_menu) # 运行主循环 root.mainloop()
在编写上述代码中,主要解决了以下几个问题:
1)原形和变形选错时的自动调节;
2)查询按钮绑定回车键,回车就可以实现检索;
3)在entry和text的控件里都添加了右键菜单,可以非常方便地进行复制和粘贴操作。
三、学后总结
1. 通过python把xlsx文件转化为sql文件,并编写可视化界面来检索这个数据库,快速得到想要的内容。
2. python在读取数据类型方面是其它工具无法超越的。这次我们充分发挥python的胶水作用,sql文件检索速度快的特点,实现了一个小型语料库的快速检索。
3. 如果我们的语料库有几十万句对,生成一个sql后再用python检索,岂不实现了数据库检索的功能?这个问题适合我们后期继续进行探讨。
到此这篇关于使用python检索数据库sql格式的文件的文章就介绍到这了,更多相关python检索sql文件内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论