首页 > 资源分享 > 资源分享 > 18岁创业者开源史上最大工厂视觉数据集,押注机器人从人类学习

18岁创业者开源史上最大工厂视觉数据集,押注机器人从人类学习

发布时间:2025-11-19 16:23:00

不久前,年仅 18 岁的创业者 Eddy Xu 在社交媒体上宣布,其创办的 Build AI 正式开源 Egocentric-10K 数据集,这是一个包含 10,000 小时第一人称视角视频的数据集,记录了 2,153 名工厂工人在真实车间环境中的实际操作场景。数据集总容量达 16.4 TB,包含超过 10.8 亿帧画面,已在 Hugging Face 平台发布,采用 Apache 2.0 许可证,允许商业使用和修改。
图片
图丨相关推文(来源:X)
Eddy Xu 在推文中写道:“历史上最大的第一人称视角数据集,机器人学习的数据扩展时代已经到来。”
Egocentric-10K 的视频全部来自真实工厂车间,而非实验室环境。工人们佩戴头戴式摄像设备,在日常工作中记录下从零件加工、分拣、组装、包装到检验的完整流程。数据统计显示,96.42% 的工作涉及至少一只手的操作,76.34% 需要双手协同,91.66% 包含主动的物体操纵动作。这些数字明显高于此前公开的同类数据集——例如 Ego4D 的手部可见率为 67.33%,EPIC-KITCHENS 则为 90.37%。
图片
图丨与其他数据集的比较(来源:X)
视频以全高清 MP4 格式存储,按工厂和工人分类组织。每个视频片段都附带 JSON 格式的元数据,包括工厂编号、工人编号、视频时长、分辨率、帧率等信息。数据集采用 WebDataset 格式,支持流式加载和部分下载,研究者可以根据需要选择特定工厂或工人的数据进行训练。
Build AI 的创始人 Eddy Xu 的成长轨迹相当传奇。2021 年,还在读初三的他就带领 Great Neck 的机器人团队 1569A OMEGA 参加 VEX 机器人世界锦标赛,在 2 万支参赛队伍中获得第 32 名。这支队伍在队员家的地下室里运营,没有家长或专业教练指导,也没有资金赞助。
图片

资源分享更多>>

魅族天猫旗舰店所有手机都下架了:一个时代终结 机圈再无小而美 利好苹果,不利好国产,智能手机领域寒风刮起 小米17U徕卡版海外定名“LEITZPHONE powered by Xiaomi” 媒体称魅族第三方硬件合作方为酷比魔方:共享Flyme系统 存储芯片持续涨价,千元机市场静悄悄:中低端需求正被动萎缩 台积电先进封装科普:CoWoS、CoPoS、CoWoP 到底是个啥?谁才是下一代最该关注的技术? 1秒3亿、单日突破10亿!老铺黄金创下天猫大促最快销售纪录 百度无代码开发平台“秒哒”已生成超100万个AI应用 DeepSeek发布下一代技术!北大实习生立功 又一车企大规模召回,440万辆! 猿辅导沉浸式素养教育展落地冰城 T3出行大数据:火车站等交通枢纽峰值日打车需求同比增长将超48% 阅文计提新丽18亿商誉减值 出清商誉风险 有道“AI原生”战略成效显著,CEO周枫:将扩大AI应用与智能体的布局 字节跳动Seedance 2.0暂停真人素材参考能力 2026高性价比换机新年送礼首选!nova 15系列国补来袭:3000元档颜值实力双在线 里程碑时刻!100B扩散语言模型892 Tokens /秒,AI另一条路走通了 小众架构赢麻了:让100B扩散模型飙出892 tokens/秒的速度! 22亿!黄仁勋苏姿丰联手,投了一家“世界模型”公司 两天痛失两位华裔大佬!马斯克万亿估值为何留不住人心? RLinf-USER发布!别再用仿真,真实世界训练也能极致效率与系统化 Moltbook之外,上交大联合上海AI Lab模拟了AI原⽣社交的真实暗⾯ 盛色推出“OF27UT Pro”27英寸显示器,1299元 曝苹果首款OLED MacBook将于Q4发布 由三星供应屏幕 一季度PC内存要翻倍涨!涨幅达历史新高 折叠版iPad!iPhone Fold外观细节出炉:音量键在顶部 折叠屏iPhone不止一款!苹果或再推覆盖式可折叠iPhone,主打便携与易收纳 苹果出手,隔空投送白嫖FCP失灵了 千问APP投入30亿,阿里加入春节AI红包大战 腾讯内部信回应元宝“春节红包”分享质疑:无门槛领取与平台旨在打击的恶意营销存在本质不同