
LabelU:开源多模态数据标注平台
产品简介
LabelU 是一款全面的数据标注平台,专为处理多模态数据而设计。它提供了一系列先进的标注工具和高效的工作流程,使用户能够轻松处理涉及图像、视频和音频的标注任务。LabelU 旨在满足复杂数据分析和模型训练的需求。
核心功能
多功能图像标注工具
LabelU 提供了一套全面的图像标注工具,包括 2D 边界框、语义分割、折线 和 关键点。这些工具可以灵活应对各种图像处理任务,如目标检测、场景分析、图像识别和机器翻译,帮助用户高效地识别、标注和分析图像。
强大的视频标注能力
在视频标注领域,LabelU 展示了令人印象深刻的处理能力,支持 视频分割、视频分类 和 视频信息提取。它非常适用于视频检索、视频摘要和动作识别等应用,使用户能够轻松处理长视频,准确提取关键信息,并支持复杂场景分析,为后续模型训练提供高质量的标注数据。
高效的音频标注工具
音频标注工具是 LabelU 的另一项关键功能。这些工具具备高效且精确的音频分析能力,支持 音频分割、音频分类 和 音频信息提取。通过可视化复杂的音频信息,LabelU 简化了音频数据处理流程,有助于开发更精确的模型。
人工智能辅助标注
LabelU 支持一键加载预标注数据,用户可以根据实际需求进行细化和调整。此功能提高了标注的效率和准确性。
AI 自动标注
LabelU 集成了 AI 模型服务,用于图像数据的自动标注。在标注页面上点击”AI Annotate”按钮,模型即可自动检测和分割对象。支持对整个任务进行批量标注,并实时跟踪进度。系统内置了三个参考模型服务器:
- Florence-2 — 轻量级,CPU 友好(约 4GB 显存)
- GroundingDINO + EfficientSAM — 高质量检测 + 分割(约 4GB 显存)
- SAM 3 — 最先进的统一模型(约 8GB 显存,需要高端 GPU)
S3 数据源导入
LabelU 支持直接从兼容 S3 的对象存储(如 AWS S3、MinIO 等)导入标注数据。用户可以在任务设置中配置数据源连接,浏览和预览文件,然后一键导入所选文件或路径下的所有文件。
特点
- 简单性:提供多种图像标注工具,通过简单的可视化配置即可完成标注。
- 灵活性:各种工具可以自由组合,满足大多数图像、视频和音频的标注需求。
- 通用性:支持导出多种数据格式,包括 JSON、COCO、MASK。
快速开始
可以通过以下方式快速体验 LabelU:
- 在线体验 LabelU 标注工具包
- 在线使用 LabelU 平台
本地部署
部署步骤如下:
- 安装 Miniconda。
- 运行命令创建 Python 3.11 环境:conda create -n labelu python=3.11
- 激活环境:conda activate labelu
- 安装 LabelU:pip install labelu
- 如需 MySQL 支持,安装:pip install labelu[mysql]
- 运行 LabelU:labelu
- 访问 http://localhost:8000/ 即可开始使用。
本地开发
开发环境搭建步骤:
- 安装 uv 包管理工具。
- 克隆仓库并进入目录。
- 运行 uv sync 创建虚拟环境并安装所有依赖。
- 复制环境配置文件并配置密钥和数据库连接。
- 下载前端静态资源。
- 运行 uv run uvicorn labelu.main:app –reload 启动服务。
标注格式
LabelU 支持多种标注格式,详细信息可参考官方文档。
引用
如果在研究工作中使用了 LabelU,请引用以下文献:
He, Conghui, Li, Wei, Jin, Zhenjiang, Xu, Chao, Wang, Bin, Lin, Dahua. (2024). Opendatalab: Empowering general artificial intelligence with open datasets. arXiv preprint arXiv:2407.13773.
相关链接
- LabelU-kit:Web 前端标注工具包(LabelU 基于此 JavaScript 工具包)
- LabelLLM:开源的大语言模型对话标注平台
- Miner U:一站式开源高质量数据提取工具
许可证
本项目采用 Apache 2.0 许可证 发布。
相关导航


思知机器人

摸鱼鸭

Notta
Claude in Excel

科大讯飞



