news 2026/3/21 10:37:19

输入电影/书籍名称,自动生成精简版剧情梗概,提取核心人物和主题,帮快速判断是否想看/读。

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
输入电影/书籍名称,自动生成精简版剧情梗概,提取核心人物和主题,帮快速判断是否想看/读。

1. 实际应用场景描述

在信息爆炸的时代,我们每天都会看到大量电影、书籍推荐,但往往只有标题和海报,难以快速判断是否值得花时间观看或阅读。

- 想看某部电影,但不确定剧情是否喜欢。

- 想读一本书,但简介太长或剧透太多。

- 需要在短时间内筛选多个作品。

如果有一个智能程序,输入电影或书籍名称,就能自动生成 精简版剧情梗概,并提取 核心人物 和 主题,就能帮助用户快速决策。

2. 痛点分析

1. 信息获取效率低:需要自己去搜索、阅读长篇简介。

2. 剧透风险:部分简介包含关键情节。

3. 筛选成本高:面对大量推荐,难以快速判断兴趣点。

4. 缺乏个性化:现有推荐系统多为评分或标签,缺少针对内容的快速摘要。

3. 核心逻辑讲解

3.1 数据来源

- 使用 公开 API(如 TMDB 电影、Open Library 书籍)获取基本信息。

- 或使用本地预存的电影/书籍数据库(演示用静态数据)。

3.2 剧情梗概生成

- 对原始简介进行 文本摘要(可用规则截取前几句,或 TF-IDF + TextRank 算法)。

- 保持简洁,避免剧透关键结局。

3.3 核心人物提取

- 使用 命名实体识别(NER) 或规则匹配(如“主演”、“主角”等关键词后的名字)。

- 可结合角色出现频率排序。

3.4 主题提取

- 使用 关键词提取(TF-IDF、TextRank)或简单规则(如高频名词)。

- 可映射到预定义主题标签(爱情、悬疑、科幻等)。

3.5 输出结构化信息

- 返回

"{title, summary, characters, themes}"。

4. 模块化代码(Python)

# media_summary.py

import re

class MediaSummary:

def __init__(self):

# 模拟数据库

self.database = {

"肖申克的救赎": {

"summary_full": "银行家安迪被误判入狱,在肖申克监狱中,他凭借智慧和毅力,最终成功越狱并揭露了典狱长的腐败。",

"characters": ["安迪", "瑞德", "典狱长"],

"themes": ["希望", "自由", "坚持"]

},

"三体": {

"summary_full": "人类与外星文明三体人的接触引发了一系列科学、政治和哲学的冲突,故事跨越数百年,探讨宇宙文明的生存法则。",

"characters": ["叶文洁", "罗辑", "程心"],

"themes": ["科幻", "文明冲突", "人性"]

}

}

def get_info(self, title):

"""根据标题获取数据"""

return self.database.get(title, None)

def generate_summary(self, full_text, max_length=50):

"""生成精简版剧情梗概(取前max_length字)"""

if len(full_text) <= max_length:

return full_text

# 简单规则:取到最后一个完整句子

sentences = re.split(r'[。!?]', full_text)

summary = ""

for s in sentences:

if len(summary + s) <= max_length:

summary += s + "。"

else:

break

return summary.strip("。")

def extract_characters(self, data):

"""提取核心人物"""

return data.get("characters", [])

def extract_themes(self, data):

"""提取主题"""

return data.get("themes", [])

def analyze(self, title):

"""主分析函数"""

data = self.get_info(title)

if not data:

return {"error": "未找到该作品"}

summary = self.generate_summary(data["summary_full"])

characters = self.extract_characters(data)

themes = self.extract_themes(data)

return {

"title": title,

"summary": summary,

"characters": characters,

"themes": themes

}

def main():

analyzer = MediaSummary()

title = input("请输入电影或书籍名称:").strip()

result = analyzer.analyze(title)

if "error" in result:

print(result["error"])

else:

print(f"\n作品:{result['title']}")

print(f"剧情梗概:{result['summary']}")

print(f"核心人物:{', '.join(result['characters'])}")

print(f"主题:{', '.join(result['themes'])}")

if __name__ == "__main__":

main()

5. README 文件

# 电影/书籍快速摘要工具

基于 Python 实现,输入电影或书籍名称,自动生成精简版剧情梗概,并提取核心人物与主题,帮助用户快速判断是否想看/读。

## 功能

- 输入作品名称

- 输出精简剧情梗概

- 提取核心人物

- 提取主题标签

## 安装

无需额外依赖,Python 3.x 直接运行。

## 使用

bash

python media_summary.py

输入作品名称即可。

## 示例

输入:`肖申克的救赎`

输出:

作品:肖申克的救赎

剧情梗概:银行家安迪被误判入狱,在肖申克监狱中,他凭借智慧和毅力,最终成功越狱并揭露了典狱长的腐败。

核心人物:安迪, 瑞德, 典狱长

主题:希望, 自由, 坚持

6. 使用说明

1. 确保 Python 环境已安装(3.6+)。

2. 下载

"media_summary.py"。

3. 运行

"python media_summary.py"。

4. 输入电影或书籍名称(需在数据库中)。

5. 查看精简摘要、核心人物、主题。

7. 核心知识点卡片

知识点 说明

文本摘要 规则截取或 TF-IDF/TextRank 算法生成精简内容

命名实体识别(NER) 提取人名等关键信息

关键词提取 识别主题词

模块化设计 分离数据获取、摘要生成、实体提取等功能

可扩展性 可接入外部 API 或训练模型提升效果

8. 总结

本项目展示了如何用 Python + 规则/NLP 方法 快速实现一个 电影/书籍快速摘要工具,解决了信息筛选和剧透风险的问题。

- 优点:响应快、结构清晰、易于扩展。

- 未来可引入 机器学习摘要模型(如 BART、T5)和外部数据源(TMDB、豆瓣 API),实现更智能的推荐与分析。

- 适合作为 AI 方法与技术课程 的实践案例,涵盖文本处理、信息抽取、API 集成等内容。

如果你愿意,可以升级为 API 版本,接入 TMDB 和豆瓣数据,并用 Transformer 模型生成摘要,让它能处理任意电影/书籍。

利用AI高效解决实际问题,如果你觉得这个工具好用,欢迎关注我!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/15 21:58:26

脱裤子放屁 - 你们讨厌这样的页面吗?

前言 平时在逛掘金和少数派等网站的时候&#xff0c;经常有跳转外链的场景&#xff0c;此时基本都会被中转到一个官方提供的提示页面。 掘金&#xff1a; 知乎&#xff1a; 少数派&#xff1a; 这种官方脱裤子放屁的行为实在令人恼火。是、是、是、我当然知道这么做有很多…

作者头像 李华
网站建设 2026/3/20 8:36:19

高集成Mini高速CAN FD系统基础芯片SIT1169Q

在汽车电子与工业自动化领域&#xff0c;CAN总线作为核心通信协议&#xff0c;对其配套芯片的集成度、可靠性与性能提出了严苛要求。芯力特推出的SIT1169Q作为一款Mini高速CAN FD系统基础芯片&#xff08;System Basis Chip, SBC&#xff09;&#xff0c;通过高度集成高速CAN F…

作者头像 李华
网站建设 2026/3/18 12:42:32

网络安全靶场推荐,通过实战快速提升技能!

前言 自学网络安全知识&#xff0c;具备一定的理论基础&#xff0c;缺乏实战经验&#xff0c;想去网络靶场体验一下&#xff0c;通过实操能快速提升实战技能&#xff01; 可推荐的网络靶场&#xff1a; 1、春秋云境.com&#xff1a;平台涵盖350CVE靶标和10套大型仿真场景&am…

作者头像 李华
网站建设 2026/3/19 4:23:07

《信息安全毕业主推的6大岗位(2025真实版)》

《信息安全毕业主推的6大岗位&#xff08;2025真实版&#xff09;》 关于我&#xff1a;资深IT专家&#xff0c;AI布道者&#xff0c;15年实战老兵多本专业图书作者大厂技术面试官。 根据2024年官方公布的数据显示,到2027年我国网络安全人员缺口将达327万。 尽管全国已有626所高…

作者头像 李华
网站建设 2026/3/15 17:48:27

64 K8s安全机制

前言 本文系统阐述Kubernetes安全机制的核心架构与实践方法&#xff0c;详细解析API Server保护的三大关键环节&#xff1a;认证、鉴权和准入控制&#xff0c;以及如何通过RBAC实现细粒度权限管理。特别聚焦在实践中如何创建安全隔离的集群访问账号&#xff0c;适用于Kubernet…

作者头像 李华
网站建设 2026/3/18 18:33:14

谷歌学术搜索使用指南:高效查找学术文献与研究资源的方法技巧

做科研的第一道坎&#xff0c;往往不是做实验&#xff0c;也不是写论文&#xff0c;而是——找文献。 很多新手科研小白会陷入一个怪圈&#xff1a;在知网、Google Scholar 上不断换关键词&#xff0c;结果要么信息过载&#xff0c;要么完全抓不到重点。今天分享几个长期使用的…

作者头像 李华