揭秘罗永浩直播带货幕后之师
鱼羊 发自 凹非寺
2020年4月1日那一天,罗永浩没有重新定义20点。
无论是他“一个理想主义创业者”演讲的老观众,还是锤子科技新品发布会的常年拥趸……都没有预料到,这一次老罗的新征程,会如此准时准点开始。
一切正在完全不同。
最终,3小时后,一切也算得上完美。直播带货支付总额突破1.1亿,累计观看人数超4800万人……按照抖音超4亿的日活用户,那天每10位用户中,就有1位进出了直播间。
这自然是罗永浩标志性的新纪录,但同样也是抖音的。
对于那晚聚集在会议室的字节跳动直播研发团队而言,他们刚经历了“惊魂一晚”,蹭蹭上涨的在线人数曲线,让他们跟系统资源容量一齐——愈来愈紧张。
他们无心细想如此大流量将刷新的历史纪录。
紧张来自研发工程师的本能:
再大流量也得丝般顺滑,一切不容有失。
“意外就是失败”
压测和演习,实际已在一个月前开始。
最近的一次,在直播开始前的5小时进行。说是压测,但接近终演彩排,不仅是码率清晰度、网络状况被反复测试调整,连麦克风放到哪一个位置更好,重点保障小组的同学们都仔细确认了一遍。
“我不喜欢意外,从研发角度而言,希望所有事情都是control的。”
说话者周鹰,字节跳动直播研发负责人。
他说百万级别的大流量,对于抖音电商直播这个场景,其实还是头一遭。
有经验的程序员都知道,像直播这样的场景,小流量是验证不出问题的,谁也说不好百万级别的流量同时涌入,会出现哪些意想不到的bug。
更不必说,电商直播不同于常规直播,订单系统、支付系统、商品管理等功能的加入,使得整个技术链条变长,业务场景更加复杂。
所以哪怕在直播开始前,已经做好了降级方案、兜底方案,演练了不知道多少次。
“做了很多的预案,出现这个问题后,我们该怎么操作,这些都是有严格的计划,甚至比如说我们发现某一路信号断了,备份信号是怎么切的,谁来负责操作,多长时间怎么去操作,这些都有严格的执行手册……”
但即便如此,当天的实战检验后,周鹰的团队成员们留下的四个字:
“焦头烂额。”
手机是否出现发热、发烫,线上数据有没有发生崩溃,周鹰团队一边盯着监控数据,一边用设备测试,还要实时关注线上用户的反馈和内部同事的反馈,几乎每一根神经都紧绷着。
稍微发现问题的苗头,就必须马上开始进行性能操作,进行兜底和保护,在其演变成严重问题之前,将其扼杀在摇篮里。
在此之前,电商直播并不是字节跳动身上所具有的标签。
所以在外界看来,罗永浩是字节跳动正式杀入电商直播战场的第一枪,也是百万量级电商直播这样的场景,在这个平台上第一次被大规模验证。
“意外,就意味着失败。”
尽管在直播领域,周鹰和他的同事们早已经历过600万同时在线人数的冲击,也支撑起了码流大、清晰度要求高的大型晚会“抖音奇妙夜”直播,但在电商直播这个领域,他们仍自视为“新人”。
因此打从罗永浩直播带货这个项目成立开始,这些一线工程师们就进入了一种“战斗状态”。
一方面,按照内部积累下来的流程走:
根据市场推广资源、推广情况计算流量曲线,估算每一个时间点的瞬时流量。在预测数据的基础上准备和扩充带宽资源。
准备初步的监控系统、降级策略以及大流量直播间重点保障操作,进行反复的压力测试、演练,演练达不到预期,就重新修改,改完继续演练……直到确保导致大型翻车的意外不会发生。
另一方面,加功能、赶排期,而来自外界的实时反馈,也在加码这个项目的分量。
比如老罗第一场直播开始前,直播研发服务端负责人安德则直言,经历了肾上腺素飙升的“心跳时刻”。
一开始,根据市场和运营同事反馈过来的数据,他们对罗永浩直播间流量的预估还没有那么高,但在关注外界讨论热度的过程中,安德发现情况不太对:
“知道不知道的人都在跟我说罗永浩直播的事,甚至连我妈都关注到了,这个对外影响力已经超出预期了。”
安德的结论是:资源肯定估少了!
于是,团队立刻着手协调,调整预估数值,扩充带宽资源。
听上去不难,短时间内协同各方的压力却不小。
幸好之前有过相似的经验可借鉴:
他们曾经遇到过同时在线人数十几倍于预估量级的紧急情况。
在自身有冗余资源准备、公司内部其他团队立刻响应、多家CDN供应商配合的情况下,那一场直播也有惊无险地撑住了。
总之,尽管做了充足的准备,随时可能出现的变化,还是让这场热热闹闹的网络狂欢背后的工程师们抹了把汗。
好在这一场大考的最终成绩,验证了所有的努力没有白费:
近200万同时在线人数,累计观看人数超4800万人,1.1亿GMV,创下抖音电商直播的新纪录。
但对于直播研发团队而言,这还仅仅是个开始。
就在当晚,项目组的成员们就在讨论群里炸开了锅,迅速整理出了当天直播中遇到的种种可以优化的地方。
字节速度也在此时展现。
到了4月10日老罗第二场直播的时候,主要的问题就都优化掉了。
当然,这种速度背后压抑着的,也是一种直播研发团队内部都已感知的紧迫感。
更早之前,他们专门为此集结,虽然更大的战略雄心不是他们的核心关注。
但作为研发工程师,他们渴望挑战、渴望创造不一样的东西,渴望用代码带来改变。
而这种改变,实际也已经在字节跳动悄然发生。
字节跳动直播研发,Why Now?
手机直播,不是新鲜事。
直播研发团队负责人周鹰,完整经历过这个新业态的“上一幕”,从秀场类开始,后来百播大战,再后来一地鸡毛。
但从整个行业而言,2019年开始有了标志性变化——
直播电商火了。
在薇娅、李佳琦这样的名字频频出现在公众眼前的同时,直播在泛娱乐属性之外,开始借由电商直播这个形式,展露出其工具属性。
也就是说,直播不再仅仅局限于秀场、游戏这样的垂直领域,而是展示出了一种新的、更具互动性的内容生产方式的可能。
这样的可能性,在2020年疫情爆发之后,意外得到了进一步验证以及大众的认可。
以抖音为例,直播火神山建设、直播教育、直播医学专家科普……越来越多通过直播形式实现的“云”活动,大大加快了直播的工具属性普及的速度。
如此一来,各类以内容、社群为主的App,即使不以直播为主,也必须考虑上线直播能力,以满足用户生产内容的需求。
字节跳动对直播的重新思考,也在2019年发生变化。
自上而下的调整则更早,在2019年年初发生。
当时,字节跳动整合了旗下抖音、火山小视频、西瓜视频的直播技术、业务团队,成立了服务于公司全线产品直播的直播研发团队。
而且重要性也是再明显不过的。
因为这个新团队的核心成员,集结了字节跳动各个项目组里的工程师。
对于字节而言,电商是新大陆,而工程师们或多或少都觉察到:
这决定了这个新业务,不会只是一个App的新尝试。
那么如何体现到组织架构和业务上?
字节跳动用了最擅长的方式——平台化。
思路很明了:用直播研发平台,去快速支撑字节跳动旗下任何App接入直播能力,提升效率。
周鹰说,直播研发团队的主要工作包括两个方面:一方面承接直播业务;另一方面把直播中通用的基础能力“平台化”,为字节跳动旗下各个App直播业务的快速迭代提供强有力支持。
“直播研发团队的建立,解决了一个App想要快速接入直播能力的问题。”
“从技术的角度来说,直播的各个环节是耦合在一起的。因此直播平台的存在,在需要快速铺开直播功能的时候,是很有意义和价值的。它的整个系统完备、经过验证,功能齐全。”
或许听起来技术上并不难,“不就是一套方案,其他业务直接接入嘛?”
但做过这支团队的研发工程师们,异口同声表示:
也是万万没想到,项目竟然这么复杂。
周鹰指出,直播研发要解决的本质问题,一方面指向基础能力,要扎实,另一方面指向应用,可以为业务需求提供支撑。
所以在开发一个新功能的时候,一开始就会考虑怎么实现App之间的快速迁移。
但考虑“通用”,就会导致研发成本的上升,研发周期变长,如何去平衡这个度,就成了摆在团队面前的一大痛点。
客户端负责人武博也解释说,由于这支团队负责的是字节跳动全线产品的直播研发,还有一些外部的合作,就需要接入多个“宿主”。
每个宿主的工程结构、架构都有不同,整个框架怎么去设计,才能满足多个业务的诉求?
站在技术的角度,挑战不可谓不大。与点播系统不同,直播关联了多个环节,比如消息、虚拟礼品、钱包,都需要耦合。而且直播电商中,实时交易要求下,还要涉及信号、时延、清晰度,供应链库存系统接入,以及支付稳定性等挑战,项目多,但每一项又都要做好。
另外,与字节跳动常见的几十个人的小团队不同,直播研发是百人级别的团队,这就对团队成员们的协调能力、判断力提出了更高的要求。
而作为一线工程师的关贺,在加入直播研发团队后,差点没让“信息爆炸”整懵。
因为支撑了各个产品线,关贺和他的同事们每天需要帮各个业务团队评估方案、解答问题,每天都会被各种信息轰炸。
“必须要学会找到方法,排清优先级。并着手搭建通用机制去解决问题。”
对于这些年轻工程师来说,他们站在一个巨大流量平台上展开新尝试,内部也没有太多经验,每天都要解决新问题,每次都是更大的压力。
苦不苦?他们说苦。
但值不值?他们觉得都很值。
“如果你有幸处在一个成长期业务上,发挥的空间、机遇很大,还有足够的潜力把它做成下一个抖音,那么业务的成就感,会持续带来满足感。”
而这种业务的成就感,也在各个维度数据中展现,从效率到规模,非常明显。
服务端负责人安德感慨:
“你忽然发现,你家娃他是个天才,作业不用辅导就能考年级第一。”
在内部的公开讨论中,直播研发的相关发展情况,也开始被越来越多提及,甚至高管还会亲自给直播研发团队报过bug。
并且抖音直播带货,在大众认知中,也开始具有标签式印象。
一方面,越来越稳定。当做“头炮”打响的罗永浩,第一次后面临各方面数据的质疑,但在其抖音直播四个月之际,他创下了新纪录——带货开播90分钟,支付金额突破1.2亿,最终GMV(成交总额)突破2亿。一条脱离了噱头的健康增长曲线,开始越来越明显。
另一方面,更多大流量也把直播带货重点,放在了抖音。比如明星陈赫,又比如小米的雷军。
至此,抖音的直播带货,“初战”告捷。也意味着直播研发,取得了开局之战的验证。
同时毫无疑问,这是字节跳动组织架构方面又一次胜利——一直践行的“大中台小前台”的逻辑,解决了技术架构与业务架构慢与贵的矛盾,实现了快速的业务增长。
同时,在技术之外,直播业务也让大家看到,字节跳动的商业模式,在广告之外还拥有更多可能性。
而在此之前,电商,并不在字节跳动的“基因”中。
小赢靠术,大赢靠道
不过,如果我们把字节跳动在直播电商上的首战告捷,完全归功于“组织架构”,那可能还不够本质。
面对时代机遇和发展趋势,适当作出战略方向调整和变革,归根到底只是术方面作为。
术可以实现小赢,一城一池、一次两次的赢。
但一次接一次、连续成功,并且是打破“基因”和“边界”式的成功,还得靠道,靠春风化雨、无所不在的人心所向和文化认同。
所谓道可道、非常道。
“直播电商是新业务,转岗意味着变化、不确定性?”
“变化再正常不过,我们讲究拥抱变化,走出舒适区,这几年里不知道多少次经历‘从0到1’了。”
“放弃之前的稳定项目,没有犹豫?”
“一直待在熟悉的项目里,成长肯定不如接受新项目新挑战来得快,字节强调‘不设边界’。”
“你之前不具有这方面的经验?”
“那就承受压力快速成长呗。从这个角度说,字节很‘激进’,按部就班不是我们的风格,我们很多工程师一开始就处于hard模式,但往往也会激发最大的潜能。”
“新项目后加班多吗?”
追求极致、不设边界、务实敢为、开放谦逊、坦诚清晰、始终创业,多元兼容、不唯背景……
比如田森,从校招进入字节跳动,到成为直播研发团队核心工程师,其实只用了三年。
被问及“秘诀”。
他说核心还是无数次走出舒适区的结果。
从西瓜视频、抖音百万英雄答题……每次都是新业务,然后新业务进入稳定状态,他就跳上另一个新业务。
另一位团队leader关贺,则从另一家视频公司跳槽而来,他那时已是业内资深工程师,业务稳定、节奏也稳定,但来到字节后,发现一切全然不同:
“每年自己都会接触到新东西,从来不会说这块太熟了,今年休息一下吧,从来没有这样……一旦你这块熟了,又会有新东西。”
他说在字节跳动,“内部项目招募”也是常态,有一个新项目需要人,你刚好感兴趣,大家一拍即合就能组队……
比如西瓜视频,最初的研发团队只有6个人,但在内部快速验证后,就会得到更多人响应,快速成为百人规模的业务团队。
“发现问题、解决问题的能力;是不是足够聪明,足够有潜力;是不是对技术真的有热情。”
在字节跳动的直播团队中,目前很多核心骨干正是受益于此:
吴小薇是毕业于浙大的生物学硕士,零编程经验,但看重字节的成长性投了简历,然后实习试用,现在已是研发团队的技术中坚。
李林是北大法学出身,94年的,本身并非“专业对口”,但目前已是iOS方向的团队leader。
还有一位团队leader,因为双非高校毕业,在其他公司面试中“吃亏”,但在字节获得认可,最后快速成长为leader。
武博觉得这种案例在字节太正常了,因为“多元兼容,不唯背景”,学校、学历提供了一个背书,但不能说明全部。
这位直播研发客户端负责人,加入字节5年多,当时面临的抉择是博士学位or时代机遇?
最后,他选择博士肄业,跳上机遇大船,因为行业和公司的成长性,就是另一种博士学位。
他说在字节跳动,对于校招的重视程度是外界难以想象的。
一般而言,社招往往能带来直接上手的人,而校招只是具备“潜力”的可能性,在很多成熟的大公司里,校招只是补充血液的一小部分。
但武博认为,校招带来的培养成本是短期的,产生的潜力和增长空间是长期的,属于“延迟满足感”的一种。
招聘的问题不在于人才是否对口,而是公司有无提供足够的培养机制和空间。
“浙大生物学那位工程师,实习4个月,毕业后入职2个月,现在跟我们正常社招两年工作经验做的事情差不多。”
已经是如此规模的字节跳动,内部工号乱序、看不到技术等级,彼此以同学称呼,没有title——除非对外时需要,就临时报备申请一个。
这也让这家成立已经8年的公司,看起来依然年轻汹涌,没有疲态,没有“边界”,似乎做什么就能成什么——像年轻人被勉励时常用的一样:年轻无极限。
字节的人才效应也正在越来越明显。
高成长性的公司、处在高成长性的行业,吸引了渴求高成长性空间的年轻人,而且年轻人又能有机会迅速上位,推动技术、业务和公司实现更高速成长,最后进一步吸引更多优秀的年轻人。
这样的循环不容易,但这样的循环一旦建立,比任何模式的壁垒,都要更稳固。