当前位置:首页 > 编程技术 > 正文内容

TXT处理小工具(过滤、分割功能)分享

yc88812个月前 (09-23)编程技术237

1、筛选功能

可以筛选出包含关键字的行、

删除包含关键字的行、

去重功能、

根据长度筛选


2、根据行数分割、根据大小分割。


import tkinter as tk
from tkinter import ttk
from tkinter import filedialog
import math
import os
def filter_contains():
    input_text = input_textbox.get("1.0", tk.END).splitlines()
    keywords = [kw.strip() for kw in keyword_textbox.get("1.0", tk.END).splitlines()]
    output_text = [line for line in input_text if any(keyword in line for keyword in keywords)]
    output_textbox.delete("1.0", tk.END)
    output_textbox.insert(tk.END, "\n".join(output_text))

def filter_remove():
    input_text = input_textbox.get("1.0", tk.END).splitlines()
    keywords = [kw.strip() for kw in keyword_textbox.get("1.0", tk.END).splitlines()]
    output_text = [line for line in input_text if not any(keyword in line for keyword in keywords)]
    output_textbox.delete("1.0", tk.END)
    output_textbox.insert(tk.END, "\n".join(output_text))

def remove_duplicates():
    input_text = input_textbox.get("1.0", tk.END).splitlines()
    output_text = list(dict.fromkeys(input_text))
    output_textbox.delete("1.0", tk.END)
    output_textbox.insert(tk.END, "\n".join(output_text))

def filter_by_length():
    input_text = input_textbox.get("1.0", tk.END).splitlines()
    length = int(length_entry.get())
    if length_var.get() == "greater":
        output_text = [line for line in input_text if len(line) > length]
    else:
        output_text = [line for line in input_text if len(line) < length]
    output_textbox.delete("1.0", tk.END)
    output_textbox.insert(tk.END, "\n".join(output_text))

def select_file():
    file_path = filedialog.askopenfilename(filetypes=[("Text files", "*.txt")])
    if file_path:
        file_info.set(file_path)
        file_size = os.path.getsize(file_path) / 1024
        num_lines = sum(1 for line in open(file_path, 'r', encoding='utf-8'))
        output_textbox_split.config(state="normal")
        output_textbox_split.delete("1.0", tk.END)
        output_textbox_split.insert(tk.END, f"文件行数: {num_lines}\n文件大小: {file_size:.2f} KB")
        output_textbox_split.config(state="disabled")


def split_file():
    file_path = file_info.get()
    if not file_path:
        output_textbox_split.config(state="normal")
        output_textbox_split.insert(tk.END, "请选择文件\n")
        output_textbox_split.config(state="disabled")
        return

    if split_var.get() == "lines":
        lines_per_file = int(split_entry.get())
        num_files = split_by_lines(file_path, lines_per_file)
    else:
        size_per_file = int(split_entry.get())
        num_files = split_by_size(file_path,  size_per_file)

    output_textbox_split.insert(tk.END, f"分割完成,共生成{num_files}个文件\n")


def split_by_lines(file_path, lines_per_file):
    with open(file_path, 'r', encoding='utf-8') as file:
        file_name, file_extension = os.path.splitext(file_path)
        i = 0
        lines = []

        for line in file:
            lines.append(line)
            if (i + 1) % lines_per_file == 0:
                write_to_file(lines, f"{file_name}_part_{(i + 1) // lines_per_file}{file_extension}")
                lines = []
            i += 1

        if lines:
            num_parts = math.ceil((i + 1) / lines_per_file)
            write_to_file(lines, f"{file_name}_part_{num_parts}{file_extension}")


def split_by_size(input_file, max_size_mb):
    sub = 1
    size = max_size_mb * 1024  # 分割大小约80K

    with open(input_file, 'rb') as fin:
        buf = fin.read(size)
        while len(buf) > 0:
            [des_filename, extname] = os.path.splitext(input_file)
            filename = f"{des_filename}_{sub}{extname}"
            write_to_file(buf.decode('utf-8'),filename)
            sub += 1
            buf = fin.read(size)

    return sub-1

def write_to_file(lines, output_path):
    with open(output_path, 'w', encoding='utf-8') as output_file:
        output_file.writelines(lines)
    output_textbox_split.config(state="normal")
    output_textbox_split.insert(tk.END, f"\n分割完成: {output_path}")
    output_textbox_split.config(state="disabled")

root = tk.Tk()
root.title("TXT处理软件")

tab_parent = ttk.Notebook(root)

tab1 = ttk.Frame(tab_parent)
tab2 = ttk.Frame(tab_parent)

tab_parent.add(tab1, text="过滤器")
tab_parent.add(tab2, text="分割器")
tab_parent.pack(expand=1, fill="both")

# 过滤器部分
input_textbox = tk.Text(tab1, width=40, height=50)
input_textbox.grid(row=0, column=0, padx=10, pady=10)

output_textbox = tk.Text(tab1, width=40, height=50)
output_textbox.grid(row=0, column=2, padx=10, pady=10)

controls_frame = tk.Frame(tab1)
controls_frame.grid(row=0, column=1, padx=10, pady=10)

keyword_label = tk.Label(controls_frame, text="关键字(换行分隔):")
keyword_label.pack()
keyword_textbox = tk.Text(controls_frame, width=20, height=10)
keyword_textbox.pack(pady=5)

contains_button = tk.Button(controls_frame, text="包含关键字", command=filter_contains)
contains_button.pack(pady=5)
remove_button = tk.Button(controls_frame, text="删除包含关键字的行", command=filter_remove)
remove_button.pack(pady=5)
remove_duplicates_button = tk.Button(controls_frame, text="去重", command=remove_duplicates)
remove_duplicates_button.pack(pady=5)

length_frame = tk.Frame(controls_frame)
length_frame.pack(pady=5)

length_label = tk.Label(length_frame, text="长度:")
length_label.pack(side=tk.LEFT)
length_entry = tk.Entry(length_frame, width=5)
length_entry.pack(side=tk.LEFT)

length_var = tk.StringVar()
greater_rb = tk.Radiobutton(length_frame, text="大于", variable=length_var, value="greater")
greater_rb.pack(side=tk.LEFT)
lesser_rb = tk.Radiobutton(length_frame, text="小于", variable=length_var, value="lesser")
lesser_rb.pack(side=tk.LEFT)

filter_length_button = tk.Button(controls_frame, text="按长度筛选", command=filter_by_length)
filter_length_button.pack(pady=5)

# 分割器部分



# 选择文件按钮
select_button = ttk.Button(tab2, text="选择文件", command=select_file)
select_button.grid(row=0, column=0)

# 文件信息
file_info = tk.StringVar()
file_info_label = ttk.Label(tab2, textvariable=file_info, width=50)
file_info_label.grid(row=0, column=1, padx=10)

# 分割方式
split_var = tk.StringVar(value="lines")
split_lines_rb = ttk.Radiobutton(tab2, text="按行数分割", variable=split_var, value="lines")
split_lines_rb.grid(row=1, column=0, sticky=tk.W)
split_size_rb = ttk.Radiobutton(tab2, text="按文件大小分割 (KB)", variable=split_var, value="size")
split_size_rb.grid(row=1, column=1, sticky=tk.W)

# 分割数量输入框
split_entry = ttk.Entry(tab2, width=10)
split_entry.grid(row=2, column=0)

# 开始分割按钮
start_split_button = ttk.Button(tab2, text="开始分割", command=split_file)
start_split_button.grid(row=2, column=1, padx=10)

# 输出框
output_textbox_split = tk.Text(tab2, width=80, height=30, wrap=tk.WORD, state="disabled")
output_textbox_split.grid(row=0, column=1, padx=10, pady=10)

root.mainloop()

TXT筛选器

TXT分割器


本站发布的内容若侵犯到您的权益,请邮件联系站长删除,我们将及时处理!


从您进入本站开始,已表示您已同意接受本站【免责声明】中的一切条款!


本站大部分下载资源收集于网络,不保证其完整性以及安全性,请下载后自行研究。


本站资源仅供学习和交流使用,版权归原作者所有,请勿商业运营、违法使用和传播!请在下载后24小时之内自觉删除。


若作商业用途,请购买正版,由于未及时购买和付费发生的侵权行为,使用者自行承担,概与本站无关。


本文链接:https://www.10zhan.com/biancheng/10758.html

标签: txt
分享给朋友:

“TXT处理小工具(过滤、分割功能)分享” 的相关文章

【说站】laravel实现自定义404页面并给页面传值

【说站】laravel实现自定义404页面并给页面传值

以 laravel5.8 为例,虽然有自带的404页面,但太简单,我们更希望能自定义404页面,将用户留在站点。实现的方式很简单,将自定义的视图文件命名为 404.blade.php,并放到 reso...

【说站】用一句话就可以去除宝塔面板操作上的二次验证

【说站】用一句话就可以去除宝塔面板操作上的二次验证

用过宝塔的朋友应该都会发现,现在宝塔面板有些鸡肋的功能,删除文件、删除数据库、删除站点等操作都需要做计算题!不仅加了几秒的延时等待,还无法跳过!这时候就会有朋友在想,如何去除宝塔面板的二次验证,此篇文...

【说站】电脑安装MySQL时出现starting the server失败原因及解决方案

【说站】电脑安装MySQL时出现starting the server失败原因及解决方案

今天在安装MySQL时出现starting the server失败,经过查询分析得出以下结论,记录一下操作步骤。原因分析:如果电脑是第一次安装MySQL,一般不会出现这样的报错。如下图所示。star...

【说站】C#在PDF中添加墨迹注释Ink Annotation的步骤详解

【说站】C#在PDF中添加墨迹注释Ink Annotation的步骤详解

PDF中的墨迹注释(Ink Annotation),表现为徒手涂鸦式的形状;该类型的注释,可任意指定形状顶点的位置及个数,通过指定的顶点,程序将连接各点绘制成平滑的曲线。下面,通过C#程序代码介绍如何...

【说站】Java从resources读取文件内容的方法有哪些

【说站】Java从resources读取文件内容的方法有哪些

本文主要介绍的是java读取resource目录下文件的方法,比如这是你的src目录的结构├── main│ ├── java│ │ └── ...

【说站】linux中redis如何以redis用户重启?

【说站】linux中redis如何以redis用户重启?

通过上图我们可以看到,目前状态是已经以 redis 用户启动着,我想修改下 redis 的密码,然后怎么以 redis 用户重启呢?redis 是 nologin 用户,不能通过 su redis 切...