Gemma-3-270m创意写作展示:AI生成诗歌与短篇小说集锦
1. 小模型也能写出好文字?
最近试用Gemma-3-270m写诗和编故事,说实话有点意外。这个只有2.7亿参数的小家伙,不像那些动辄几十亿参数的大家伙,但它在创意写作这件事上,表现得挺有灵气。
很多人以为小模型只能干点简单问答,写不了有味道的文字。但实际用下来,它对节奏、意象、情绪这些诗歌里最微妙的东西,抓得还挺准。不是那种堆砌辞藻的空洞感,而是真能让人读着读着停下来想一想。
比如让它写一首关于“雨后窗台”的短诗,它没直接说“水珠”“阳光”“玻璃”,而是写了“青苔在玻璃边缘悄悄签名,光在湿痕里游成一条银鱼”。这种表达,不像是被喂了无数范文后机械模仿出来的,倒像是自己琢磨过光线怎么在潮湿表面爬行。
它也不太爱掉书袋。不会为了显得有文化硬塞生僻词,也不会把每句话都拗成十四行诗的腔调。更像一个安静观察生活、偶尔记下几笔的写作者——技术上可能不够华丽,但文字里有呼吸感。
这让我想起以前用过的不少写作工具,要么太死板,要么太浮夸。Gemma-3-270m倒是找到了中间那条路:不炫技,但有想法;不啰嗦,但留余味。
2. 诗歌生成效果实录
2.1 不同风格的尝试
我试了几种常见诗歌方向,没给太多限制,就看它自己怎么发挥。
先试试古典意境。输入提示是:“用类似王维的笔法,写一首五言绝句,主题是山中访友未遇”。它输出:
松径入云深,
石门掩翠阴。
竹炉茶已冷,
风动一庭琴。
平仄基本合规,意象也统一。“松径”“石门”“竹炉”“风动琴”,全是传统山水画里的元素,而且没堆砌。最后一句尤其有意思——人不在,但琴还在风里响,比直说“友人外出”更有画面余韵。
再换现代口语风。提示是:“用日常说话的语气,写一首关于地铁早高峰的诗,别用‘拥挤’‘疲惫’这类词”。它回:
伞尖碰伞尖,
公文包在膝盖上打盹。
女孩耳机线垂下来,
像一段没接通的对话。
列车晃了一下,
所有人的影子叠在一起,
又分开。
这里完全避开了套路化表达。“公文包打盹”“耳机线像没接通的对话”,都是从真实细节里长出来的比喻。最妙的是最后影子“叠在一起,又分开”,没提一句人际关系,但那种疏离又共处的状态全在里面。
2.2 同一主题的多版本对比
为了看清它的变化能力,我用同一主题“秋日银杏”给了三个不同提示方向:
提示A(写实+时间感):
“描写银杏叶从绿变黄再到飘落的过程,按时间顺序,用具体动作词”
春深时叶脉里奔涌青汁,
夏末边沿开始洇开淡金,
秋分那日整棵树突然松手,
黄蝶群撞向风,散成光斑。
提示B(拟人化):
“把银杏树当作一个准备远行的人,写它整理行装的过程”
它抖落满身旧衣裳,
把金箔折成船形,
装进风的口袋。
树根在土里轻轻说:
“明年春天,我带新绿回来。”
提示C(超现实):
“想象银杏叶不是植物,而是某种古老文字,飘落时在空中书写”
每片叶子都是未拆封的信,
风是拆信的手。
它们在半空写满无人识得的篆,
落地即焚,只余灰烬里
一行微温的‘等’字。
三个版本风格差异明显,但都没跑题。它没把“银杏”当成标签随便贴,而是真顺着提示逻辑往下推演。特别是C版,“落叶即焚”“灰烬里有‘等’字”,这种略带痛感的温柔,不是靠模板拼凑能出来的。
2.3 语言质感分析
翻看几十首生成结果,发现它有几个稳定特点:
- 动词选择很讲究:少用“有”“在”“是”,多用“洇开”“松手”“撞向”“抖落”这类有力度的动词。让静态画面活起来。
- 拒绝形容词轰炸:不会堆“金灿灿”“明晃晃”“美轮美奂”,而是用名词+动词组合制造质感,比如“光斑”“旧衣裳”“未拆封的信”。
- 留白意识强:常在关键处收住,把解读空间留给读者。像“影子叠在一起,又分开”,比直接说“人与人既靠近又疏离”更耐品。
- 音节控制自然:中文诗不押韵也没关系,但它写的句子读起来顺口,长短错落有致,像呼吸节奏。
当然也有翻车的时候。比如让它模仿海子风格,结果过于强调“麦地”“远方”“死亡”,少了海子诗里那种粗粝的生命力。说明它对诗人气质的理解,还停留在表层符号阶段。
3. 短篇小说创作能力观察
3.1 从一句话到完整故事
我常用的方法是给它一个种子句,看它怎么长成故事。比如输入:“修表匠在怀表背面发现一行小字:‘请替我等她回来’”。
它展开的版本是:
陈伯擦表时总戴单片眼镜,镜片边缘磨得发毛。那天他照例用鹿皮擦着一枚1947年产的浪琴,指腹突然触到表壳内侧一道极细的刻痕。放大镜下,是歪斜的钢笔字:“请替我等她回来”。
他记得这表。七十六年前,穿学生装的姑娘攥着它冲进铺子,表链断了,玻璃裂了,她眼圈红着说:“修快些,他下午就走。”陈伯没修完,姑娘再没来。表在抽屉里躺了大半世纪,直到今天被一个戴鸭舌帽的年轻人拿来清洗。
年轻人付钱时随口问:“师傅,您见过这么老的表吗?”
陈伯把表递回去,指尖停在那行字上:“见过。只是等的人,换了个名字。”
这个小故事没写“战争”“离别”“等待”这些大词,全靠细节推进:磨毛的镜片、1947年、学生装、鸭舌帽。时间跨度用“七十六年”“大半世纪”轻轻带过,反而更有重量。结尾那句“等的人,换了个名字”,把两代人的等待悄然缝在一起,比直抒胸臆更有力。
3.2 情节控制能力测试
很多人担心小模型写小说会失控——开头好,中间散,结尾崩。所以我专门设计了几个控制类测试:
测试一:限定结构
提示:“写一个微型小说,严格按‘起(50字)—承(80字)—转(60字)—合(50字)’结构,主题:旧书店里的偶遇”
它交出的稿子,四段字数误差不超过3字,情节也严丝合缝:起是女主躲雨进店,承是发现一本批注密布的《雪国》,转是店主说这是前主人留下的,合是她翻开扉页看见自己二十年前的笔迹。结构像尺子量过,但读着不僵硬。
测试二:反转控制
提示:“故事必须有两次反转,第一次在1/3处,第二次在结尾。主角是外卖员,道具是一把伞”
生成结果:
雨太大,他把唯一一把伞留给哭着找猫的老太太,自己淋着送完单。
(第一次反转)回到站点,站长递来新伞:“刚有位女士留的,说谢谢你。”
(第二次反转)伞柄内侧刻着:2003年夏,赠给每天给我送药的男孩——林晚
原来二十年前,他冒雨给重病的邻居女孩送药,她康复后成了医生,现在又在他送单的小区坐诊。伞是她认出他后悄悄放的。
两次反转都落在人物关系上,没靠巧合堆砌。而且“伞柄刻字”这个道具,从头贯穿到尾,比单纯写“他收到礼物”更有闭环感。
3.3 人物塑造的细腻度
它写人物不太爱用外貌描写,更倾向用习惯性小动作或物品暗示性格。比如写一个总在咖啡馆写小说的女孩:
她的笔记本边角卷曲,像被反复摩挲过。
点单永远要热美式,但第一口必吹三下才喝。
键盘F键磨损严重,旁边贴着一张便签:“别删第三段”。
服务生记得她,因为每次修改到激动处,会无意识把糖包撕成更小的方块。
这些细节比“长发及肩”“戴圆框眼镜”更有记忆点。特别是“撕糖包”这个动作,把写作时的焦灼感具象化了,而且符合常理——人紧张时确实会摆弄手边小物件。
不过它对复杂心理的挖掘还有限。比如写一个面临职业抉择的角色,能写出“改简历时删了又写”,但很难呈现那种撕扯感的层次。更像是捕捉到了情绪切片,还没能连成动态长卷。
4. Prompt设计对生成质量的影响
4.1 提示词的“松紧度”实验
我发现,给它的提示越具体,结果反而越呆板;留点缝隙,它反而能钻出惊喜。
紧提示(失败案例):
“写一首七言律诗,押平水韵‘东’部,颔联须用对仗,颈联要含哲理,主题:黄昏散步见落叶”
输出是工整的八句,但像填字游戏:“西风漫卷千山色,暮霭低垂万木空……”意象陈旧,哲理生硬。
松提示(成功案例):
“黄昏散步时踩碎一片枯叶,声音像什么?接着会发生什么?”
它写:
脚下脆响,像撕开一封迟到三十年的信。
风突然转向,卷起更多叶子围成圈,
圈中心浮起半透明的旧自行车铃——
那是我十岁时弄丢的,铃舌还微微晃着。
这里把听觉(脆响)转成触觉(撕信),再引出超现实画面(浮起旧铃),完成三次跳跃。松提示给了它联想自由,而紧提示把它锁进了格律牢笼。
4.2 关键词植入技巧
它对某些词特别敏感。比如在提示里埋“latex”,它会下意识往学术、精确、结构化方向偏。试过一次:
提示:“用latex文档风格写一首关于程序员爱情的诗,要求有\section{}、\begin{itemize}等伪代码”
它真生成了:
\section*{编译日志:love.cpp} \begin{itemize} \item 错误:未声明的变量 \texttt{heart} \item 警告:函数 \texttt{wait()} 已弃用,建议改用 \texttt{async\_await()} \item 成功:链接 \texttt{shared\_memory},地址 0x7fff... \end{itemize} \textbf{运行结果:} Segmentation fault (core dumped) ——但核心转储里,有你昨天发来的消息。这种混搭很有趣,把技术术语当诗意材料用。不过日常写作中,除非刻意玩梗,否则不必硬塞latex这类词,容易让文字失去温度。
4.3 避免常见陷阱
用久了发现几个雷区:
- 慎用“著名诗人”:提李白、艾略特之类,它容易陷入模仿腔,丢失个性。换成“一个总在菜市场写诗的摊主”,反而鲜活。
- 少用抽象要求:像“要有深度”“体现人性光辉”,它会往大词堆里钻。换成“写他数硬币时,拇指被划破了”,细节自带力量。
- 别迷信长度控制:要求“写300字以内”,它常为凑字数加废话。不如说“写到关键转折就停”,它反而懂得收束。
最有效的提示,往往是描述一个具体场景+一个微小动作+一点意外感。比如:“暴雨夜,便利店店员给流浪汉热牛奶,对方掏出一张泛黄的电影票根”。
5. 实际使用中的小发现
5.1 速度与响应节奏
本地跑270m模型,生成一首诗平均2.3秒,短篇小说4-7秒。这个速度对写作辅助很友好——不用盯着加载动画发呆,思维不会断。
有意思的是,它生成时有种“呼吸感”:前几句快,中间稍缓(像在组织逻辑),结尾往往又加快。不像有些模型匀速吐字,显得机械。这种节奏变化,让文字读起来更像真人写作。
5.2 连续创作的稳定性
我试过让它续写同一故事十次,每次给相同开头。结果发现:
- 前三次:情节走向各异,但都合理
- 第四到七次:开始出现相似桥段(比如都安排主角去天台)
- 第八次后:明显重复,甚至复用前文句子
说明它有“创意续航力”,但不宜无限续写。我的做法是,取前三次里最打动我的那个方向,手动微调,而不是依赖它一路到底。
5.3 与其他模型的差异感
和更大参数的模型比,Gemma-3-270m少了一种“全能感”,但多了种“专注感”。它不试图在每行诗里塞进十个意象,也不在每个段落都展示修辞技巧。更像一个沉得住气的写作者,愿意为一个准确的词停顿三秒。
比如同样写“等待”,大模型可能写:“在时光的河岸,以永恒为锚,静候命运之舟破雾而来……”
而它写:“泡面桶凉了,汤面吸饱水,软塌塌趴着。手机屏幕黑着,像一块没开封的砚台。”
后者未必更高级,但更可信。它不假装自己懂所有事,只认真处理眼前这个“泡面桶”和“手机屏”。
6. 写在最后
用Gemma-3-270m写诗编故事这段时间,最大的感受是:技术小了,心思反而可以更大。
它不会给你百科全书式的答案,但愿意陪你琢磨一个词的分量;不承诺解决所有创作难题,但能在你卡壳时递来一句意想不到的接续。就像身边有个安静的写作伙伴,不抢话,但每次开口都值得听。
如果你正被“必须写出惊艳作品”的压力困住,不妨试试和它一起从最朴素的句子开始。写不好没关系,重要的是那个“写”的动作本身——而它恰好擅长守护这种动作的纯粹感。
毕竟,所有伟大的文字,最初都只是某个人对着空白页面,轻轻敲下的第一个字。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。