news 2026/6/12 21:20:22

Python 第三方库:darts(现代化时间序列建模与预测框架)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Python 第三方库:darts(现代化时间序列建模与预测框架)

darts 是一个专门用于时间序列分析、建模与预测的 Python 库,提供统一而高层的 API,集成了统计模型(如 ARIMA)、机器学习模型(如 LightGBM)、深度学习模型(如 RNN、Transformer、N-BEATS、TCN 等)以及时间序列特有的处理工具(如窗口生成、协变量管理、回测、误差评估等)。

darts 的设计目标是让时间序列预测像使用 scikit-learn 一样简单,同时让深度学习模型的构建更加易用。

安装:

pip install darts

如需使用深度学习模型:

pip install darts[u]

常见应用场景:

(1)时间序列预测(Forecasting)

使用 ARIMA、RNN、Transformer、N-BEATS 等模型进行未来值预测。

(2)多元时间序列建模

支持多变量输入、协变量(covariates)、滞后特征等复杂数据结构。

(3)回测与模型评估

内置回测、滚动预测、交叉验证与误差指标。

(4)异常检测

支持时间序列的异常值检测及预测残差分析。

(5)时间序列处理

提供插值、缩放、缺失值填补、时间对齐等操作。

(6)深度学习时间序列模型

内置 PyTorch 实现的专业算法,如:

• RNNModel

• TCNModel

• NBEATSModel

• TransformerModel

• TFTModel(Temporal Fusion Transformer)

拥有高性能与易用性的平衡。

◆ ◆

核心概念

1、TimeSeries 对象(核心数据结构)

darts 所有模型的输入与输出均为 TimeSeries 类型。

它包含:

• 时间索引(DatetimeIndex 或 RangeIndex)

• 数据列(可以是一列或多列)

• 可选的附加维度(例如多个样本)

创建方式示例:

from darts import TimeSeriesimport pandas as pd df = pd.read_csv("data.csv")series = TimeSeries.from_dataframe(df, "date", "value")

2、预测模型(Models)

darts 的模型分为:

• 统计模型(ARIMA、Exponential Smoothing、Theta 等)

• 机器学习模型(RegressionModel)

• 深度学习模型(NBEATS、RNN、TFT 等)

• EnsembleModel(用于模型集成)

每一个模型都提供统一的 API:

model = SomeModel(...)model.fit(series)forecast = model.predict(n)

3、协变量(Covariates)

时间序列预测常需要外生变量,如:

• 天气

• 节假日

• 商品价格

• 滞后窗口

darts 支持三类协变量:

• past_covariates:过去已知的数据

• future_covariates:未来已知的数据(如节日表)

• static_covariates:不会随时间变化的特征

4、回测(Backtesting)

darts 内置回测工具,通过滑动窗口自动评估模型表现:

from darts.metrics import mape model.backtest( series, forecast_horizon=12, metric=mape)

5、误差指标(Metrics)

支持:

• MAE

• RMSE

• MAPE

• SMAPE

• DTW 距离

• R2 score

用于评估预测效果。

◆ ◆

应用举例

例 1:加载数据并创建 TimeSeries

from darts import TimeSeriesimport pandas as pd df = pd.read_csv("sales.csv")series = TimeSeries.from_dataframe(df, "date", "sales")

例 2:使用 ARIMA 进行预测

from darts.models import ARIMA model = ARIMA()model.fit(series)forecast = model.predict(12)forecast.plot(label="forecast")

例 3:使用深度学习模型(N-BEATS)

from darts.models import NBEATSModel model = NBEATSModel( input_chunk_length=24, output_chunk_length=12, n_epochs=50,) model.fit(series)prediction = model.predict(12)

例 4:使用协变量进行多元预测(RNN)

from darts.models import RNNModel model = RNNModel( model="LSTM", input_chunk_length=30, output_chunk_length=7) model.fit(series, future_covariates=weather_series)forecast = model.predict(7, future_covariates=weather_series)

例 5:回测评估模型

from darts.metrics import smape error = model.backtest( series, forecast_horizon=12, metric=smape,)print("SMAPE:", error)

◆ ◆

常用函数与类速览

TimeSeries.from_dataframe(df, time_col, value_cols)

从 DataFrame 创建时间序列对象。

参数:

df:pandas DataFrame。

time_col:时间列名。

value_cols:数值列名或列表。

返回:TimeSeries 实例。

model.fit(series, **covariates)

训练模型。

参数:

series:目标时间序列。

past_covariates:可选,历史协变量。

future_covariates:可选,未来协变量。

返回:无。

model.predict(n, **covariates)

预测未来 n 步。

参数:

n:预测步数。

future_covariates:未来外生变量。

返回:TimeSeries 类型的预测结果。

model.backtest(series, forecast_horizon, metric)

对时间序列执行滑动窗口回测。

参数:

series:目标时间序列。

forecast_horizon:一次预测步数。

metric:误差函数。

返回:float(误差值)。

TimeSeries.plot()

快速绘制时间序列。

参数: 无。

返回: 无(生成图形)。

📘 小结

darts 是一套现代化的时间序列分析框架,具有以下优势:

• 统一的 API,几十种模型可无缝切换

• 内置深度学习模型,支持 PyTorch 训练

• 支持协变量、窗口生成、多元时间序列

• 强大的回测工具与评估指标

• TimeSeries 统一数据结构,简化时间序列处理

• 可从快速原型扩展到企业级模型

无论你是做金融预测、供应链预测,还是做科学研究或智能调度,darts 都提供稳定、灵活而完整的工具链。

“点赞有美意,赞赏是鼓励”

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/30 9:22:24

合作伙伴计划推出:招募代理商扩大市场覆盖

合作伙伴计划推出:招募代理商扩大市场覆盖 在企业智能化转型的浪潮中,一个现实问题始终困扰着组织决策者:如何让大语言模型真正“懂”自己的业务?通用AI助手或许能流畅回答百科问题,但在面对内部制度、客户合同或技术文…

作者头像 李华
网站建设 2026/6/12 14:06:54

快速引流策略曝光:用Anything-LLM生成高质量SEO技术文章

快速引流策略曝光:用Anything-LLM生成高质量SEO技术文章 在搜索引擎竞争日益激烈的今天,技术类内容的创作早已不再是“写得越多越好”,而是“谁更专业、谁更可信、谁更能解决实际问题”。然而,许多团队仍困于一个尴尬境地&#x…

作者头像 李华
网站建设 2026/6/10 17:38:49

TCO总拥有成本分析:五年使用周期内的支出

TCO总拥有成本分析:五年使用周期内的支出 在企业加速拥抱AI的今天,部署一个稳定、安全且可持续运行的大语言模型(LLM)系统,早已不只是“能不能用”的问题,而是“长期划不划算”的考量。许多团队初期被开源模…

作者头像 李华
网站建设 2026/6/10 20:17:38

碳足迹追踪:计算产品全生命周期排放量

碳足迹追踪:计算产品全生命周期排放量 在碳中和目标席卷全球的今天,企业面临的已不仅是“要不要减排”,而是“如何准确地算出自己排了多少”。从欧盟的《绿色新政》到中国的“双碳”战略,监管机构正逐步要求企业披露产品的完整碳足…

作者头像 李华
网站建设 2026/5/30 17:51:18

GitHub Star增长技巧:吸引更多开发者关注

GitHub Star增长技巧:吸引更多开发者关注 在开源世界里,一个项目的影响力往往不靠论文或宣传册来定义,而是体现在它被多少人“点亮”了那颗星——GitHub 的 Star 数。这颗小星星背后,是开发者的认可、社区的关注,甚至是…

作者头像 李华