在刚刚结束的第五届字节跳动奖学金颁奖典礼上,字节跳动技术副总裁杨震原通过回顾过去 12 年的技术演进,分享了一些外界鲜为人知的“幕后故事”。
比如这家以算法著称的公司,其实早在 2021 年就曾尝试训练大语言模型并用于搜索相关性任务,但因为当时效果提升微弱且成本高昂,得出了「这个LLM目前没什么用」的结论,一度搁置,「所以还是很没眼光」。
但凭借在基础设施(Infra)领域的深厚积累,字节在 2022 年迅速调整方向并后来居上。其构建的 MegaScale 训练系统实现了超过 55% 的浮点运算利用率(MFU),不仅支撑了“豆包”成为中国最流行的 AI 助手之一,也让火山引擎能以极低的成本提供模型服务。
而在硬件领域,针对 2023 年 Pico 减少市场营销投入的动作,杨震原澄清道,这是因为当时的硬件体验尚未成熟,公司选择转向更底层的核心技术攻坚。
为了解决传统 VR 设备“看不清”的痛点,字节跳动自 2022 年起与供应商联合定制 MicroOLED 屏幕,试图将 PPD(角分辨率)从行业的 20 提升至 40 以上,其 4000 PPI 的像素密度甚至是 iPhone 17 Pro Max 的近 9 倍 。
此外,为了解决 MR 混合现实中的眩晕与延迟问题,字节跳动甚至全链路自研了一颗头显专用芯片,芯片在2024年回片,目前进入量产阶段,各项指标均达到设计要求,目前系统延迟已压低至 12 毫秒,远超行业 25 毫秒的极限。
杨震原也透露,经过这些底层技术的沉淀,新的 XR 产品预计将在 2026 年发布。
而从 2014 年团队仅仅只有 5 个人负责核心算法,却定下一个激进的目标:在第一版推荐系统中就实现“万亿(T)级别”的特征规模的故事里,也能看出这家公司在面对技术浪潮时的决策逻辑与工程底色。
面向未来,杨震原提出了一个关于 AGI 的思考实验:只有当 AI 能完成人类 95% 的工作(从初级客服到顶尖科学家)时,才能称之为实现了通用人工智能。
目前大模型在“持续学习能力”和“与物理世界交互(IO)”方面仍有短板,这正是技术人未来需要攻克的关键方向 。
以下为杨震原分享原文: