24、时间序列聚类：k-Shape、k-Means与HDBSCAN算法对比-开发者社区

时间序列聚类：k-Shape、k-Means与HDBSCAN算法对比

1. k-Shape算法简介

k-Shape算法是一种强大的时间序列聚类算法，它使用归一化的互相关来计算聚类中心，并在每次迭代中更新时间序列到这些聚类的分配。该算法具有以下特点：
-尺度和位移不变性：不受数据尺度和位移的影响。
-领域无关性：可应用于多个领域。
-可扩展性：迭代细化过程的复杂度与序列数量呈线性关系，且所需参数调整极少。

k-Shape与k-Means算法类似，都采用迭代方法根据数据与最近聚类中心的距离将数据分配到不同组。但关键区别在于k-Shape使用基于形状的距离计算方法，该方法依赖于互相关。

2. 使用k-Shape对ECGFiveDays数据集进行时间序列聚类

2.1 数据准备

我们将使用UCR时间序列集合中的数据，由于文件大小超过100MB，需从UCR时间序列网站下载。该集合是最大的带类标签的时间序列数据集公共集合，共包含85个数据集，来自多个领域，可用于测试模型在不同领域的性能。每个时间序列仅属于一个类，可用于验证聚类结果。

首先，加载必要的库：

'''Main''' import numpy as np import pandas as pd import os, time, re import pickle, gzip, datetime from os import listdi

修复 EKS CloudWatch Agent 无法访问 IMDS 问题

问题现象在 EKS 集群中，部分节点上的 CloudWatch Agent Pods 持续处于 CrashLoopBackOff 状态，查看日志发现以下错误： E! [EC2] Fetch identity document from EC2 metadata fail: EC2MetadataRequestError: failed to get EC2 instance identity document caused by: EC…

李华

AIGC与CI/CD的深度融合：在流水线中嵌入AI测试评估节点

从自动化到智能化，测试节点的范式转移‌ 随着以大型语言模型（LLM）、多模态模型为代表的AIGC技术走向成熟，软件测试领域正迎来从“脚本执行自动化”向“测试活动智能化”的根本性跨越。传统的CI/CD流水线虽然实现了构建、部署、基础…

李华

5分钟快速上手Potrace：从位图到矢量的终极转换指南

5分钟快速上手Potrace：从位图到矢量的终极转换指南【免费下载链接】potrace [mirror] Tool for tracing a bitmap, which means, transforming a bitmap into a smooth, scalable image 项目地址: https://gitcode.com/gh_mirrors/pot/potrace 在数字设计领…

李华

跨平台直播聚合开发指南：构建多源直播应用实战

跨平台直播聚合开发指南：构建多源直播应用实战【免费下载链接】dart_simple_live 简简单单的看直播项目地址: https://gitcode.com/GitHub_Trending/da/dart_simple_live 在移动互联网时代，直播已成为重要的娱乐和信息获取方式。面对各大直播平…

李华

语音合成新纪元：GPT-SoVITS实现高自然度音色克隆

语音合成新纪元：GPT-SoVITS实现高自然度音色克隆在数字人、虚拟主播和个性化AI助手日益普及的今天，一个核心问题逐渐浮现：如何让机器说话不仅“像人”，还能“像你”？传统的语音合成系统虽然能朗读文本，但声…

李华

Steam游戏管理终极指南：GreenLuma 2024 Manager完整使用教程

Steam游戏管理终极指南：GreenLuma 2024 Manager完整使用教程【免费下载链接】GreenLuma-2024-Manager An app made in python to manage GreenLuma 2024 AppList 项目地址: https://gitcode.com/gh_mirrors/gr/GreenLuma-2024-Manager 想要轻松管理Steam游戏…

李华