news 2026/2/11 5:08:09

UKB数据库/RAP平台批量下载数据教程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
UKB数据库/RAP平台批量下载数据教程

使用 Table Exporter方法
第一步:
通过在本地终端(请确保你的机器上安装了dx-toolkit)或ttyd终端,执行以下命令,获取包含你数据集中所有可用数据字段的文件:

dx extract_dataset project-xxxx:record-yyyy -ddd --delimiter ","
where project-xxxx:record-yyyy is ID of your Dataset

【安装dx-toolkit】打开本地电脑中的Anaconda Prompt
【安装dx-toolkit】在Anaconda Prompt中输入

pip install dxpy

系统会进行自动安装。

假如出现类似以下报错:

WARNING: The scripts dx, dx-app-wizard, dx-build-app and dx-build-applet are installed in '/Users/user-amy/Library/Python/3.9/bin' which is not on PATH. Consider adding this directory to PATH

说明需要更新电脑的PATH环境变量配置,以包括pip安装新命令的路径(具体解决方案自行百度)。

【CLI登录】在Anaconda Prompt中输入

dx login

服务器连接成功后按提示输入RAP的用户名和密码即可

现在输入:

dx extract_dataset project-xxxx:record-yyyy -ddd --delimiter ","

注意!

project-xxxx:record-yyyy为你的数据库 例如xxxxx.dataset

完成后有三个文件

上述命令将生成3个*.csv文件,其中*.dataset.data_dictionary.csv文件包含所有可用数据字段的完整信息(字段名称位于称为 的第二列name)。

where project-xxxx:record-yyyy is ID of your Dataset

【登出/注销CLI】使用完毕养成好习惯需要登出/注销,在Anaconda Prompt中输入:

dx logout

第二步:
接下来使用Table Exporter

收集所有感兴趣的数据字段名称,并写入field_name.txt文件。文件应有1列,每行只有1个数据字段名称。上述文件应仅包含同一实体中的数据字段(例如“参与者”、“olink_instance_0”等)。不同实体中的数据字段应写入独立文件。用于的值可以在.dataset.data_dictionary.csv文件的第一列中找到(注:这与entity_dictionary.csv文件中的不同)

注意这一步:
可以在自己电脑上新建txt,
但是!
需要用Visual Studio Code软件将txt转化为unix格式的txt !!!
也可,自行百度查看其他方法windows的txt转unix的txt.

用 VS Code 打开文件 查看右下角状态栏,会显示 "CRLF" 或 "LF" 点击 "CRLF" 或 "LF",选择 "LF" 保存文件

第三步
将field_name.txt文件上传到RAP项目

根据需要,
我用这个

注意:指定实体会快更多!


到这个就批量下载完成!

RAP官网下载教程如下:

https://dnanexus.gitbook.io/uk-biobank-rap/working-on-the-research-analysis-platform/accessing-data/accessing-phenotypic-data
https://documentation.dnanexus.com/developer/apps/developing-spark-apps/table-exporter-application

可进行进一步参考!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/8 9:12:45

翱翔未来:为何这家eVTOL服务商值得关注

一架造型前卫的电动飞行器在成都上空轻盈起飞,没有震耳的噪音,只有轻微的低鸣,很快融入了都市的天际线。傍晚高峰时段,成都天府软件园附近,一架造型前卫的电动飞行器轻盈起飞,没有震耳的噪音,只…

作者头像 李华
网站建设 2026/2/7 15:19:56

java基于Springboot卖家乐二手电子产品回收系统-vue

目录已开发项目效果实现截图关于博主开发技术介绍核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!已开发…

作者头像 李华
网站建设 2026/2/8 15:50:40

CCF-GESP计算机学会等级考试2025年12月二级C++T2 黄金格

B4448 [GESP202512 二级] 黄金格 题目描述 小杨在探险时发现了一张神奇的矩形地图,地图有 HHH 行和 WWW 列。每个格子的坐标是 (r,c)(r, c)(r,c),其中 rrr 表示行号从 111 到 HHH,ccc 表示列号 111 到 WWW。 小杨听说地图中隐藏着一些“黄金格…

作者头像 李华
网站建设 2026/2/8 6:26:15

基于Android和Spring Boot 的个性化美食点餐推荐系统 订餐系统设计 小程序

目录已开发项目效果实现截图关于博主开发技术介绍核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!已开发…

作者头像 李华
网站建设 2026/2/5 13:16:04

第零章:我们面对的是怎样的“怪物”?

这不是一个标准的云平台项目。如果沿用建造“商品房”的思路去应对,我们注定会失败。因为我们要构建的,是一幢同时要容纳重型精密机床、海量图书馆和瞬息万变指挥中心的奇异大厦。开篇之前,我们必须认清,我们面对的究竟是怎样一头…

作者头像 李华