news 2026/5/8 21:11:33

(初阶) 从零开始:Tushare环境配置与基础数据获取

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
(初阶) 从零开始:Tushare环境配置与基础数据获取

去年接触到量化投资这个概念时,我面对的第一个问题不是策略怎么写、回测怎么做,而是——数据从哪来?市面上主流的金融数据终端动辄上万一年,对个人量化爱好者来说实在吃不消。

幸运的是,我遇到了Tushare。这是一个完全免费开源的Python财经数据接口包,从日线K线到宏观指标,从A股到港股美股,几乎覆盖了量化分析所需的所有基础数据。今天这篇文章,我想把我的踩坑经验和学习路径分享给同样从零开始的朋友。

一、环境准备与基础配置

1.1 安装Tushare

打开你的命令行工具(Windows用户用CMD或PowerShell,Mac用户用终端),输入以下命令:

bash

pip install tushare

如果你的电脑同时安装了Python 2和Python 3,可能需要明确指定版本:

bash

pip3 install tushare --upgrade

安装完成后,导入验证:

python

import tushare as ts print(ts.__version__) # 建议确保版本号大于1.2.10
1.2 注册与获取Token

访问Tushare官网完成注册。需要注意的是,现在Tushare需要手机号验证,建议直接用常用手机号注册。注册成功后,进入「个人中心」→「API管理」→「立即开通」,会得到一个专属的API Token。

新手小贴士:免费版每天可以调用500次,对初期的学习和探索来说完全够用。如果想解锁更多数据,每天签到就能攒积分,完全不花一分钱。

1.3 Token安全配置(重要敏感信息配置)

很多新手会直接把Token写在代码里,这是一个不太好的习惯。建议把它保存在环境变量中:

python

import os import tushare as ts pro = ts.pro_api(os.getenv('TUSHARE_TOKEN')) # 从环境变量读取token

二、获取日线行情数据

有了Token,我们就可以开始获取最基础的日线数据了。

python

import pandas as pd # 获取贵州茅台2023年日线数据 df = pro.daily(ts_code='600519.SH', start_date='20230101', end_date='20231231') print(df.head())

参数说明

  • ts_code:股票代码,6开头加.SH(沪市),0和3开头加.SZ(深市)

  • start_date/end_date:格式必须为YYYYMMDD

  • asset:默认是E(股票),还有I(指数)、F(期货)等选项

返回的数据包含以下关键字段:

字段含义字段含义
trade_date交易日期open开盘价
close收盘价high最高价
low最低价volume成交量

三、数据清洗与准备

获取到的数据默认按trade_date逆序排列,而且trade_date是int类型,需要转成datetime。

python

# 按日期顺序排列 df = df.sort_values('trade_date', ascending=True) # 将trade_date转为datetime并设为索引 df['trade_date'] = pd.to_datetime(df['trade_date']) df.set_index('trade_date', inplace=True)

四、可视化基础:画出第一张K线图

一切准备就绪,让我们画出第一张股价走势图:

python

import matplotlib.pyplot as plt plt.figure(figsize=(14, 7)) plt.plot(df.index, df['close'], label='收盘价', color='#1f77b4', linewidth=1.5) plt.title('贵州茅台2023全年股价走势图', fontsize=16, fontweight='bold') plt.xlabel('日期', fontsize=12) plt.ylabel('价格(元)', fontsize=12) plt.grid(alpha=0.3) plt.legend(loc='upper left') plt.tight_layout() plt.show()

运行后就能看到一整年的股价曲线!对于刚刚接触量化的小白来说,这样的成就感正是继续探索的最好动力。

小结:今天我们从零搭建了Tushare环境、学会了获取日线数据、完成了数据的基础清洗和可视化。这些看似简单的操作,其实是整个量化分析流程的地基。下一篇,我们将在此基础上学习如何同时获取多只股票数据,并开始构建第一个量化策略。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/8 21:07:44

基于MCP协议构建AI任务管理服务器:原理、配置与实战

1. 项目概述:一个为AI设计的任务管理MCP服务器如果你和我一样,日常开发中重度依赖像Claude、Cursor这类AI助手,那你肯定遇到过这个痛点:想让AI帮你管理项目待办事项,结果要么是它记不住,要么是它把任务清单…

作者头像 李华
网站建设 2026/5/8 21:03:39

本地AI代理框架palot:从YAML配置到实战应用全解析

1. 项目概述与核心价值 最近在折腾本地AI应用部署时,发现了一个挺有意思的项目—— ItsWendell/palot 。乍一看这个名字,你可能会有点摸不着头脑,这到底是做什么的?简单来说, palot 是一个专注于 本地化、轻量级、…

作者头像 李华
网站建设 2026/5/8 21:02:30

基于BERT的分子性质预测模型技术解析与应用

1. 项目背景与核心价值分子性质预测一直是药物发现和材料设计领域的核心挑战。传统方法依赖量子力学计算或实验测定,前者计算成本高昂,后者耗时费力。2018年Google提出的BERT模型在自然语言处理领域取得突破性进展,其双向注意力机制和上下文感…

作者头像 李华
网站建设 2026/5/8 20:53:40

AI搜索时代内容优化实战:GEO工具包审计与结构化数据生成指南

1. 项目概述:为AI搜索时代优化你的内容工具箱 如果你还在用传统的SEO思维做内容,那可能已经落后了。过去一年,我亲眼见证了流量格局的剧变:来自ChatGPT、Perplexity、Copilot这类AI搜索引擎的访问量,正在以惊人的速度…

作者头像 李华