buildingSMART China
BIMNet 数据集与评估基准 (中国)
2025 WinnerStudent Research 学生研究类

BIMNet:
开源的 Scan-to-BIM 数据与评估基准

当前 AEC 行业亟需将物理世界的扫描结果稳定转化为具有丰富语义的 BIM 模型,但通用计算机视觉 (CV) 数据集往往只关注家具等非结构物,难以满足建筑级训练要求。清华大学软件学院为此推出了 BIMNet——一个基于 openBIM 的大规模特定领域基准数据集。

★ 荣获 2025 buildingSMART openBIM 学生研究类大奖。通过 IFC 标准的极强互操作性,为学术界和工业界搭建了一座 AI 算法落地 AEC 领域的桥梁。

Monumental Scale

面向 AI 时代的
建筑元数据工程

该项目提供了 25 个高质量的真实室内扫描场景,包含超过 1.165 亿个点。数据集不仅涵盖了 382 个房间和超过 8,700 平方米的面积,更重要的是,它为每个场景配备了严格遵循预定义 IDM 标准的 IFC 模型真值 (Ground Truth)。

与传统 CV 数据集不同,BIMNet 的标注系统完全由 IFC 语义驱动。研究团队开发了通过 IFC 几何轮廓自动对齐和修正点云标注的技术,极大缓解了算法在处理结构构件(如梁、柱等)时常遭遇的数据不平衡和长尾分布问题。

数据规模
1.16亿个点云数据点
空间面积
8700+平方米扫描覆盖
语义种类
14类BIMNet-14 专属建筑标签
性能提升
13%mean IoU 标注质量跃升
Core Technologies

用 openBIM 连接计算机视觉

研究不再满足于简单的包围盒评估,而是直接利用 IFC 模型作为多维度评估框架的唯一基准。

01

IFC 驱动的点云标注

利用准确构建的 IFC 组件几何轮廓,直接将复杂 3D 扫描数据赋予高精度的建筑元素(IfcWall, IfcBeam 等)分类标签。

02

3D-IoU 与 3D 紧凑度

直接读取用户算法生成的 IFC,通过布尔交并比计算其与真值模型的几何形状与位置吻合度,杜绝传统转换偏差。

03

图相似度拓扑验证

提取 IFC 中的空间 (IfcSpace) 节点与门 (IfcDoor) 节点建立关系图,利用图编辑距离 (GED) 评估重构模型的空间连通性正确率。

04

开源生态赋能

数据公开发布后短短数月内,即被 20 多家顶尖大学、科技企业和研究所用于训练及评估其次世代 Scan-to-BIM 算法。

OpenBIM Workflow

从三维扫描到结构语义的标准化流程

01
多源激光扫描
融合 TLS 与 MLS 采集技术
获取真实世界存在遮挡点云
构建复杂环境数据底座
02
真值模型创建
基于 IDM 规范手动建树
涵盖8个核心结构族
确保语义-几何绝对统一
03
模型级性能测算
直接载入 IFC 文件评测
量化计算多维准确率
输出可视化偏差热力图
04
生态工具对接
输出标准的 IFC 2x3/4
无缝联通 Revit/Blender
直接用于下游分析
项目技术要素IFC 2x3/4 + TLS/MLS 激光扫描 + 深度学习 (Deep Learning) + 图编辑距离算法 (GED)
Project Teams

获奖团队

申报单位 (Submitter)

清华大学软件学院
School of Software, Tsinghua University

为算法部署提供坚实地基

以往由于缺少标准的 IFC 基准真相 (Ground Truth),产业界在评估供应商工具时存在巨大风险,BIMNet 改变了这种局面。

20+
应用机构
迅速被超过 20 家科研及商业机构采纳用于算法训练
0转换
无缝对接工作流
生成的模型零障碍直供设计与碰撞检查
图级别
拓扑评估
首次在基准测试中引入图神经网络关联性评价
10x
评估效率
比传统网格到点比对方式快一个数量级

降低改造成本的数字化前站 (Sustainability)

BIMNet 的深远可持续性意义在于,它大幅降低了既有建筑数字化与逆向工程的门槛。准确且快速生成的 IFC 现有结构模型,是建筑碳排放跟踪、生命周期分析 (LCA) 和适应性再利用规划的“刚需”起点。通过向全社会开源此经过精细语义标注的庞大数据集,研究团队避免了无数初创企业及科研人员重复进行高昂、危险的现场人工测绘与低效数据预处理环节——将创新真正聚焦于算法升级自身。

Award Impact Image