物流(交通运输仓储和邮政业)、 物流效率相关数据
数据是自己整理的
可直接导入stata
31省省级(包含西藏)数据 2010-2021年
无缺失值
1.物流业从业人员数
2.物流业固定资产投资
3.等级公路里程
4.货运量
5.交通运输仓储和邮政业增加值
6.货物周转量
7.交通运输财政支出
8.交通运输财政支出/财政总支出
中国31个省份(含西藏)2010–2021年物流与交通相关经济指标的面板数据,共包含31省 × 12年 = 372条观测值,且无缺失值,非常适合用于实证研究、政策分析、学术论文或产业报告。
下面我将为您详细解析如何使用这套高质量数据,并提供Stata 操作指南 + 实证模型建议 + 可视化方法。
✅ 一、数据集概览
| 变量名 | 中文含义 | 单位 | 数据类型 |
|---|---|---|---|
year | 年份 | 年 | 数值型 |
city | 省级行政区 | 省份名称 | 字符串 |
从业人员数 | 物流业从业人员 | 万人 | 数值 |
固定资产投资 | 物流业固定资产投资 | 亿元 | 数值 |
等级公路里程 | 公路总里程(高速公路、一级、二级等) | 公里 | 数值 |
货运量 | 货运总量 | 万吨 | 数值 |
增加值 | 交通运输仓储和邮政业增加值 | 亿元 | 数值 |
货物周转量 | 货物运输周转量 | 亿吨公里 | 数值 |
财政支出 | 交通运输财政支出 | 亿元 | 数值 |
财政支出占比 | 交通运输财政支出 / 财政总支出 | % | 数值 |
一等公路里程 | 高速公路里程 | 公里 | 数值 |
二等公路里程 | 一级公路里程 | 公里 | 数值 |
高速等级公路里程 | 高速+一级+二级公路合计 | 公里 | 数值 |
公路里程 | 总公路里程 | 公里 | 数值 |
铁路营业里程 | 铁路运营里程 | 公里 | 数值 |
💡特点:
- 时间跨度:2010–2021(12年)
- 地理范围:31个省/自治区/直辖市(含西藏)
- 无缺失值 → 直接可用,无需插补
- 可直接导入 Stata、R、Python
✅ 二、典型应用场景
🎯 1.学术研究(论文写作)
- 主题:
- “基础设施投入对物流效率的影响”
- “财政支出与区域物流发展关系”
- “数字经济发展对传统物流模式的冲击”
- 方法:
- 固定效应模型(FE)、随机效应模型(RE)
- 系统GMM(动态面板)
- 工具变量法(IV)处理内生性
🏭 2.政府/企业决策支持
- 分析各省物流发展水平差异
- 评估交通基建投资回报率
- 制定区域物流发展规划
📊 3.可视化与报告
- 制作《中国物流发展白皮书》
- 各省物流效率排名图
- 时间趋势图(如货运量增长)
✅ 三、Stata 使用教程(推荐工具)
🔹 步骤1:导入数据
* 导入Excel文件 import excel "your_data.xlsx", clear firstrow(clear) case(lower) * 设置面板结构 xtset city year, yearly✅ 如果是
.csv文件:
import delimited "your_data.csv", clear clear🔹 步骤2:数据清洗与整理
* 将城市名转为代码(可选) gen id = _n * 检查是否有重复项 duplicates report city year * 去重(如有) duplicates drop city year, force * 定义因变量和自变量 gen log_freight_volume = ln(货运量) gen log_road_mileage = ln(公路里程) gen log_investment = ln(固定资产投资) gen log_workers = ln(从业人员数)🔹 步骤3:描述性统计
summarize 货运量 货物周转量 增加值 固定资产投资 等级公路里程 tabstat 货运量 货物周转量, by(city) columns(mean) stats(mean sd min max)🔹 步骤4:构建回归模型(示例)
🧪 模型1:物流效率 = f(基础设施 + 投资 + 政策)
* 因变量:货运量(代表物流效率) * 自变量:公路里程、固定资产投资、财政支出占比 reg 货运量 等级公路里程 固定资产投资 财政支出占比 i.city i.year * 固定效应模型(更严谨) xtreg 货运量 等级公路里程 固定资产投资 财政支出占比, fe robust * 随机效应模型 xtreg 货运量 等级公路里程 固定资产投资 财政支出占比, re robust * Hausman检验选择FE or RE hausman . .🔹 步骤5:动态面板(系统GMM)
* 若考虑滞后效应(如上一年度影响本年度) xtabond2 货运量 L.货运量 等级公路里程 固定资产投资 财政支出占比, gmm(L.货运量) iv(等级公路里程 固定资产投资 财政支出占比) robust🔹 步骤6:可视化图表
📈 1. 时间趋势图(全国平均)
twoway (line 货运量 year, sort), title("全国货运量趋势") xlabel(2010(1)2021)🌐 2. 省际对比雷达图(Top 5 省份)
* 提取前5大货运量省份 sort 货运量 keep in 1/5 graph bar 货运量 货物周转量 增加值, over(city) title("TOP5 省份物流指标")🗺️ 3. 省地图热力图(需地理包)
* 安装地图包 ssc install map * 或使用 GeoGraff✅ 四、进阶分析建议
| 分析方向 | 方法 | 说明 |
|---|---|---|
| 物流效率测算 | Malmquist指数、DEA模型 | 用frontier或dea包 |
| 空间溢出效应 | 空间杜宾模型(SDM) | 加入邻近省份影响 |
| 政策评估 | DID(双重差分) | 如“某省高铁开通前后对比” |
| 数字经济影响 | 构造“数字基础设施”代理变量 | 如宽带普及率、电商渗透率 |
✅ 五、数据增强建议(未来扩展)
| 新变量 | 来源 | 用途 |
|---|---|---|
| GDP | 国家统计局 | 控制经济规模 |
| 人口 | 人口普查 | 控制需求基数 |
| 电商交易额 | 电商平台 | 数字经济驱动 |
| 高铁里程 | 交通部 | 高速交通影响 |
| 港口吞吐量 | 海关总署 | 对外开放程度 |
💡 建议整合到一个综合数据库中,形成“中国省级物流发展数据库”
✅ 六、输出成果示例
📄 论文标题建议:
- 《基础设施投入对区域物流效率的影响研究——基于2010–2021年中国省级面板数据》
- 《财政支出结构与物流产业发展关系的实证分析》
- 《交通网络扩张如何提升物流能力?——来自中国的证据》
📊 图表建议:
- 各省物流效率排名(2010 vs 2021)
- 公路里程与货运量的散点图(带拟合线)
- 财政支出占比与物流增速的相关性图
✅ 七、注意事项
- 单位统一:确保所有变量单位一致(如“亿元”、“万吨”)
- 异常值处理:检查极端值(如西藏货运量极低是否合理)
- 数据来源标注:注明原始数据来自国家统计局、交通运输部等
- 版权问题:仅限学术/非商业用途,避免商业传播