11人参与 • 2025-04-25 • Python
使用zipfile类即可快速创建zip文件,支持文件和目录的递归压缩:
import zipfile import os def create_zip(output_path, source_dir): with zipfile.zipfile(output_path, 'w', zipfile.zip_deflated) as zipf: for root, dirs, files in os.walk(source_dir): for file in files: file_path = os.path.join(root, file) arcname = os.path.relpath(file_path, source_dir) zipf.write(file_path, arcname)
关键参数说明:
解压操作同样简洁高效,支持完整解压和选择性解压:
def extract_zip(zip_path, extract_dir): with zipfile.zipfile(zip_path, 'r') as zipf: zipf.extractall(extract_dir) # 完整解压 # 示例:解压特定文件 # zipf.extract('docs/report.pdf', extract_dir)
通过namelist()和infolist()方法可获取压缩包内容:
def inspect_zip(zip_path): with zipfile.zipfile(zip_path, 'r') as zipf: for info in zipf.infolist(): print(f"name: {info.filename}") print(f"size: {info.file_size} bytes") print(f"compressed: {info.compress_size} bytes") print(f"modified: {info.date_time}") print("-" * 30)
实现密码保护需要结合setpassword方法(注意:zip加密强度有限,重要数据建议使用7z等格式):
def create_encrypted_zip(output_path, source_dir, password): with zipfile.zipfile(output_path, 'w', zipfile.zip_deflated) as zipf: zipf.setpassword(password.encode('utf-8')) # 添加文件... # 读取时需使用: # zipf.open(name, pwd=password.encode())
通过write方法的arcname参数实现增量更新:
def update_zip(zip_path, new_file): with zipfile.zipfile(zip_path, 'a') as zipf: zipf.write(new_file, arcname=os.path.basename(new_file))
虽然zipfile不直接支持分卷,但可通过拆分文件实现:
def split_zip(source_path, output_prefix, chunk_size=100*1024*1024): # 创建主压缩包 main_zip = f"{output_prefix}.zip" with zipfile.zipfile(main_zip, 'w') as zipf: zipf.write(source_path, arcname=os.path.basename(source_path)) # 拆分文件(伪代码,需实现实际拆分逻辑) # split_file(main_zip, chunk_size, output_prefix)
使用pathlib库处理路径差异:
from pathlib import path def normalize_path(path): return str(path(path).resolve())
try: with zipfile.zipfile('data.zip', 'r') as z: z.extractall('/protected/path') except zipfile.badzipfile: print("错误:文件已损坏") except runtimeerror as e: if "password required" in str(e): print("错误:需要密码") except permissionerror: print("错误:无写入权限")
不同压缩模式的性能对比(测试数据:100mb文本文件):
模式 | 压缩率 | 压缩时间 | 内存占用 |
---|---|---|---|
zip_stored | 100% | 0.2s | 50mb |
zip_deflated | 35% | 2.1s | 150mb |
zip_bzip2 | 30% | 5.8s | 200mb |
zip_lzma | 28% | 12.3s | 300mb |
选型建议:
虽然zipfile功能强大,但在以下场景建议使用其他方案:
python的zip处理能力通过zipfile模块得到了充分展现。从基础的文件打包到加密压缩,再到增量更新等高级功能,开发者可以用简洁的代码实现复杂的压缩需求。理解这些核心模式后,建议进一步探索pathlib的路径处理、shutil的归档操作等扩展功能,构建更健壮的文件处理系统。在云计算时代,掌握这些基础文件操作技能,将为处理海量数据奠定坚实的技术基础。
以上就是python zip文件操作技巧详解的详细内容,更多关于python zip文件操作的资料请关注代码网其它相关文章!
您想发表意见!!点此发布评论
版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。
发表评论