Phi-3.5-mini-instruct惊艳案例：从模糊需求描述生成可运行Python脚本-开发者社区

Phi-3.5-mini-instruct惊艳案例：从模糊需求描述生成可运行Python脚本

1. 引言

想象一下这样的场景：你脑海中有一个模糊的编程需求，但不确定具体该怎么实现。传统方式可能需要反复搜索、尝试各种代码片段，甚至需要请教同事。现在，Phi-3.5-mini-instruct可以帮你直接把模糊想法变成可运行的Python脚本。

微软推出的这款轻量级开源指令微调大模型，在长上下文代码理解(RepoQA)和多语言MMLU等基准测试中表现优异，甚至能与更大规模的模型一较高下。最令人惊喜的是，它能在单张RTX 4090显卡上流畅运行，显存占用仅约7GB，非常适合本地或边缘部署。

本文将展示Phi-3.5-mini-instruct如何理解模糊的自然语言描述，并生成可直接运行的Python代码。通过几个真实案例，你会看到这个模型的强大能力。

2. 模型部署与准备

2.1 快速部署指南

Phi-3.5-mini-instruct的部署非常简单。如果你已经准备好RTX 4090级别的显卡，可以按照以下步骤快速启动服务：

# 启动服务 supervisorctl start phi-3.5-mini-instruct # 检查服务状态 supervisorctl status phi-3.5-mini-instruct

服务启动后，你可以通过浏览器访问http://localhost:7860来使用模型的Web界面。

2.2 硬件配置建议

虽然Phi-3.5-mini-instruct对硬件要求不高，但为了获得最佳体验，建议配置：

GPU: NVIDIA RTX 4090或同等性能显卡
显存: 至少8GB
内存: 16GB以上

模型大小约7.6GB，运行时显存占用约7.7GB，完全可以在消费级显卡上流畅运行。

3. 从模糊描述生成代码的惊艳案例

3.1 案例一：数据清洗自动化

模糊需求描述： "我需要一个脚本，能读取CSV文件，删除空行，把日期列统一格式化为YYYY-MM-DD，然后保存为新文件"

模型生成的Python代码：

import pandas as pd from datetime import datetime def clean_csv(input_file, output_file): # 读取CSV文件 df = pd.read_csv(input_file) # 删除空行 df = df.dropna(how='all') # 尝试统一格式化日期列 for col in df.columns: if 'date' in col.lower(): # 假设日期列名包含'date' try: df[col] = pd.to_datetime(df[col]).dt.strftime('%Y-%m-%d') except: pass # 如果转换失败，保持原样 # 保存处理后的文件 df.to_csv(output_file, index=False) print(f"文件已处理并保存为: {output_file}") # 使用示例 clean_csv('input.csv', 'cleaned_output.csv')

效果分析：这段代码完美实现了需求：

使用pandas处理CSV文件
自动识别可能包含日期的列
对日期格式进行统一处理
保留了原始数据中无法转换的内容
提供了清晰的函数接口

3.2 案例二：自动化邮件发送

模糊需求描述： "写个脚本，每周一早上9点自动发送包含上周销售数据的邮件给团队，数据来自数据库，邮件要美观一点"

模型生成的Python代码：

import smtplib import pandas as pd from email.mime.text import MIMEText from email.mime.multipart import MIMEMultipart import schedule import time from datetime import datetime, timedelta def get_sales_data(): # 这里替换为实际的数据库连接代码 # 示例: 返回模拟数据 data = { '日期': ['2023-01-01', '2023-01-02'], '销售额': [12000, 15000], '订单数': [45, 52] } return pd.DataFrame(data) def send_sales_report(): # 获取上周数据 last_week = datetime.now() - timedelta(days=7) sales_data = get_sales_data() # 创建HTML邮件内容 html = f""" <h2>上周销售报告 ({last_week.strftime('%Y-%m-%d')} 至 {datetime.now().strftime('%Y-%m-%d')})</h2> {sales_data.to_html()} <p>总销售额: ${sales_data['销售额'].sum():,}</p> <p>总订单数: {sales_data['订单数'].sum()}</p> """ # 设置邮件 msg = MIMEMultipart() msg['From'] = 'your_email@example.com' msg['To'] = 'team@example.com' msg['Subject'] = '每周销售报告' msg.attach(MIMEText(html, 'html')) # 发送邮件 with smtplib.SMTP('smtp.example.com', 587) as server: server.starttls() server.login('your_email@example.com', 'your_password') server.send_message(msg) print("销售报告已发送") # 设置每周一早上9点执行 schedule.every().monday.at("09:00").do(send_sales_report) # 保持脚本运行 while True: schedule.run_pending() time.sleep(60)

代码亮点：

自动计算上周日期范围
生成美观的HTML格式邮件
包含销售数据汇总统计
使用schedule库实现定时任务
提供了完整的邮件发送功能

3.3 案例三：图像批量处理工具

模糊需求描述： "需要一个工具能批量处理文件夹里的图片：调整大小为800x600，添加水印，然后保存到新文件夹"

模型生成的Python代码：

from PIL import Image, ImageDraw, ImageFont import os def add_watermark(image, text="Sample Watermark"): # 创建可绘制对象 draw = ImageDraw.Draw(image) # 使用默认字体或指定字体 try: font = ImageFont.truetype("arial.ttf", 36) except: font = ImageFont.load_default() # 计算文字位置(右下角) text_width, text_height = draw.textsize(text, font) x = image.width - text_width - 10 y = image.height - text_height - 10 # 添加水印(半透明) draw.text((x, y), text, font=font, fill=(255, 255, 255, 128)) return image def process_images(input_folder, output_folder, size=(800, 600)): # 确保输出文件夹存在 os.makedirs(output_folder, exist_ok=True) # 处理所有图片 for filename in os.listdir(input_folder): if filename.lower().endswith(('.png', '.jpg', '.jpeg')): try: # 打开图片 img_path = os.path.join(input_folder, filename) img = Image.open(img_path) # 调整大小(保持比例) img.thumbnail(size, Image.ANTIALIAS) # 添加水印 img = add_watermark(img, "My Watermark") # 保存处理后的图片 output_path = os.path.join(output_folder, filename) img.save(output_path) print(f"已处理: {filename}") except Exception as e: print(f"处理 {filename} 时出错: {e}") # 使用示例 process_images("input_images", "output_images")

功能分析：

保持图片比例调整大小
可自定义的水印文字
自动识别常见图片格式
完善的错误处理
进度反馈

4. 使用技巧与最佳实践

4.1 如何写出好的提示词

要让Phi-3.5-mini-instruct生成高质量的代码，提示词很关键。以下是几个技巧：

明确输入输出：说明输入是什么，期望的输出是什么
- 差："处理图片"
- 好："写一个Python函数，接收图片路径，调整大小为800x600，保存为新文件"
指定关键要求：列出必须包含的功能点
- 示例："需要错误处理、日志记录和进度显示"
提供示例：如果有特定格式要求，给个例子
- 示例："日期格式应为YYYY-MM-DD，如2023-01-01"