流动的硅谷:AI 大潮、大厂探秘及华人国际化

This article is not available in the current language yet. Showing the original version.
硅谷是流动的,流动的人才、流动的信息、流动的资金,带来了活力和创新,让每天都在变化,感觉永远年轻。

作者:Melissa

这次在硅谷前后呆了有六周,来时盛夏,离开时刚刚过了立秋。加州的阳光永远灿烂,在科技最前沿的这里,涌动着AI的浪潮。因为希望更深入地了解AI发展和方向,我见了不少人(包括大厂的朋友们、创业者和投资人),参加线上线下活动,真切感受到大潮初起时的澎湃。这里采撷几朵浪花,跟大家分享。

疫情过后:人力短缺和远程工作

疫情已成为过去时,不过也许因为我是初来乍到,看到三年留下的痕迹格外清晰。其中感触最深的是人力短缺和远程工作的影响。

人力短缺

硅谷人力短缺明显,加之近来通货膨胀,结果就是人工非常贵。有次我用Uber Eat叫了subway外卖,三明治本身8元,但是外卖费用林林总总加起来,一共17元,多了一倍还不止!我之前在西雅图生活多年,一直知道美国人工不比中国,但是看到这个还是吃了一惊。了解了下,一大原因是疫情期间,因为担心传染等,不少人离职或提前退休。加上前两年政府发钱,工作的人少了很多。跟一位做AI教育的创业者聊,他说教师的短缺非常严重。这是整个美国面临的问题,不知道将如何解决。

远程工作

而疫情期间开始的远程工作影响更大,尤其是新毕业的大学生们。有两位朋友自己创业,他们都分别跟我提及这个问题。疫情要求隔离,大学生在校时就没有机会去公司实习。毕业后工作又是远程,没有过跟同事相处的经历。这些导致他们不知道如何进行团队合作,lead也很难远程指导。他们招过很好学校的毕业生(包括斯坦福),学生潜力很好,因为不会合作最终都不得不让他们离开,很可惜。

现在大厂陆续开始要求员工来公司上班,不过还没有恢复到疫情前。多年前我在Expedia团队招的毕业生,现在是一家AI公司创始人。他觉得远程工作很影响效率。疫情期间,他不敢要求员工来,担心要求了员工离职。目前他在看大厂的节奏,等大厂明确要求了,他就会跟上。我在大厂和创业公司看到的实际情况,来办公室上班的人还是有限。跟朋友们讨论,大家对此的态度也不完全一致。总体上一个人管理的团队越大,对远程工作这个方式越不满。大家觉得慢慢会恢复到从前,但是也不太可能一蹴而就。

说个有趣的观察。Google、Meta等大厂都在Palo Alto和Mountain View,导致附近的房价很贵,远些的地方房子就便宜很多。因为远程工作不用来公司,结果这两年远些地方的房价也涨势甚好。

AI大潮:格局初定,非常早期

我关注的重点是AI。总结一下,这一个多月以来在硅谷关于AI的几点观察和判断。

大模型和GPU

大模型本身的行业格局初定。跟中国百模千模大战不同,硅谷有几个大模型胜出,闭源主要是OpenAI和Google,Anthropic也可以算上,开源是Meta Llama-2等。因为通用大模型的投入极高,需要大量人力、算力和资金,格局看上去基本确定,没有什么新的入场者。

GPU依然短缺,无论是大厂还是创业公司。大家都在找GPU。NVIDIA的学弟给我科普了GPU生产过程,是从准备矿砂讲起的。硬件不是我关注的重点,我了解有限。听上去由于生产周期很长,导致短期内GPU的短缺,长期应该ok。

AI非常早期

说起AI领域现状,一位投资人朋友形容得很生动。他说现在就像天还没亮,每个人都拿着个手电筒在四处照来照去,寻找方向。还没有到当年移动互联网真正兴起的情形。我跟不少朋友聊过,包括大模型开发者、使用大模型的大小公司、以及围绕大模型提供产品服务的Infra/工具的创业公司。总体的判断是大模型应用还在非常早期。

有个例子很有代表性。我有位朋友,之前是一家非常有名的上市公司的VP of Engineering;这几年出来创业,做eCommerce平台相关,有一百多员工,背后有美国几家知名基金投资。她的业务用得上大模型,最近她在探索怎么做,做了两个尝试。一是在MosaicML模型上,对私有数据进行fine tune。一是用GPT-4,把私有数据放在vector database,用search-retrieval把对应信息放到prompt里。两者对比,出乎她意料的是GPT-4居然比fine tune的结果要好。她很困惑,不知道fine tune应该怎么做才有效果。需要什么样的数据,用多少数据,如何finetune, 这些都不大清楚。而且,大模型是个黑盒,她觉得做大模型的人也未必对此很明白。另外,她说MosaicML用起来的体验并不好,不过也没有别的工具供选择。GPT-4虽然效果不错,她的私有数据又不可能公开,用来测试可以,正式产品是不行的。她觉得现有团队这方面的技术力量有限,接下来计划招AI工程师来解决这个问题。

我听了有点吃惊。因为她本人很资深,整个创业团队背景光鲜,技术实力不错。她如果还不清楚如何有效地fine tune,那其他公司可想而知。她的这个结果对比(fine tune不如GPT-4 search-retrieval),也不是特例,我听到多个类似的例子。我另一位朋友的创业公司是提供AI工具,服务大的企业客户。他说,大模型对大企业是全新的技术,他的客户们都是刚刚开始考虑,他们对于模型的精准度、速度、需要准备的数据质量和隐私问题,尤为关注。客户对于具体要用AI解决哪些业务问题,也在探索中。他判断至少要6-12个月大企业才可能在内部落地使用。

可见这一轮AI还处于非常早期的阶段,C端还没有看到killer app(除了ChatGPT), B端落地也需要时间,AI infra和工具层,应该还有很大的发展空间。比如Databricks花13亿美金收购MosaicML,就是希望尽快建立起AI能力赋能给客户。

这里我看到两个积极信息:

正是因为还在早期,工具不完善,大企业没有现成的技术可用,才给创业公司留出了空间。如果大公司马上就能用起来,他们有自己的数据和场景,创业公司的机会就少多了。这是跟硅谷徐老师Howie讨论时,他提的观点,我很有共鸣。

大企业迫切地想利用起AI,至少很有危机感。我了解到,针对这轮GenAI,很多企业内部都设立了专门的预算。钱既然准备好了,即便在早期发展慢些,AI的前景还是很光明,不太容易凉凉。

为什么感觉这两个月AI发展慢下来了?

不知道大家感觉如何,比起年初,最近两三个月我感觉AI领域的节奏明显慢下来了。为什么是这样?观察下来,大致如下:

跟OpenAI的策略有关。这波节奏主要是OpenAI引领,它之前一直在憋大招,把过去两三年的成果(比如GPT-3),从去年年底起用两三个月的时间都放出来,让人感觉目不暇接。经过这段时间追赶,Google成为强有力的对手,如今OpenAI也不敢随便推出没有ready的产品,否则得不偿失。所以,最近没有特别大的变化,感觉上可能比之前慢了。其实,我觉得这才是技术应有的节奏,本来就没有那么快。

创业者在埋头Build了。我在硅谷AI社区做了个讲座,谈到这个问题。社区的反馈,年初时创业者们忙着参加各种会议/讲座/meetup学习讨论,想弄明白GenAI是怎么回事。最近大家对大模型技术基本清楚了,开始忙着花时间构建自己的产品。外面看起来,好像没之前那么热闹了。

在研究领域,一篇篇论文还是在不断发表,并没有变慢。

一级市场的确慢下来

整体一级市场的投资节奏感觉有所减慢。主要跟大环境相关。人们觉得未来经济走势不明朗,而俄乌战争又增加了不确定性,影响人们投资的信心。另外,疫情期间政府大放水导致很多创业项目估值涨得很高,现在还在估值回调的过程中。在这个大背景下,AI领域的一级市场其实相对算好的。不过因为还在很早期,我观察到除了真正做大模型的有竞争力的项目(包括character.ai 其实也是在做大模型)拿到了很多钱,其他的AI创业项目,现在融资并不容易,投资人很多在观望。

大厂探秘:OpenAI,Google,NVIDIA

这波AI大潮中,OpenAI & Microsoft、Google和NVIDIA成为时代的弄潮儿。其中三家总部在硅谷,我特地去了解了下,总结下可以分享的信息。

OpenAI

OpenAI对信息保护非常在意,员工对此也很敏感。我了解到的不是很多,有几点印象相对深刻。

跟OpenAI合作的人都提到,他们的员工很能干,非常高效。它的系统性能和监控做得尤其好,工程能力很强。也许,Infra的工程能力 – 如何更高效地利用硬件、提升性能等,是它的一个核心壁垒。

OpenAI执着于AGI,这点我具体聊下来才真正有些体会。他们内部判断工作优先级,会看这个能不能帮助AGI发展。如果能够更好地训练模型,帮助模型学习,那会去做;否则不会花功夫。比如他们之前做过机器人,觉得受实际物理世界的制约很大,对AGI帮助有限,后来就停了。照此推断,它大概率不会去做垂直领域。

ChatGPT出现前,用户对LLM效果如何是没有感知的。让用户感知到是非常重要的。除了AGI,ChatGPT和API也是OpenAI的重点。

Google

之前Google在AI推进上比较慢,除了跟广告业务冲突,还跟两件事相关。一是有位研究员觉得大模型有意识,被解雇。再之前,有位黑人女性员工因为发论文被拒,告Google。这些让Google对AI变得非常谨慎,减缓了AI的进度。

Google一直觉得自己是领先的,直到ChatGPT出现,给到Google很大的压力。12月份内部开始code red(最高优先级),是比较少见的。现在公司上下对GPT非常重视,有专门团队做GPT(DeepMind和Google Brain合并),也鼓励其他团队尽快把AI用上。我有不少朋友在Google,聊起来,他们对Google有信心,觉得这方面Google至少不会落后。

NVIDIA

这次LLM大潮,NVIDIA成了最大的赢家。我其实对这家公司一直关注不多,因为我的经历和兴趣都在软件方面。这次好好了解了一下,发现很有意思,这里多分享一些。

一个人的Startup

NVIDIA的风格,概括说,是老黄Jason一个人的创业公司。在那里工作的朋友对Jason非常佩服,我听下来感觉Jason是个Superman。Jason一直相信Compute,无论股价如何,从2012年开始坚持做,从来没犹豫过。Jason对技术懂得非常深,对项目实际情况了解,又平易近人。如果有的事情决定不了,大家都去问Jason,他做决策又快又好。

Jason很有同情心。比如疫情刚开始时,本来公司平时是9月份做员工评估,他决定提前做。结果3月份全公司完成了评估,提薪和奖金,让大家提前拿到钱。同时Jason有洞察力,也有危机感,很受员工欢迎。即便在之前股价不好的时候,员工对他的评价也很高。

强调技术,组织扁平

它的公司文化跟我了解的其他公司有明显差异。作为一家近3万人的公司,NVIDIA至今没有people manager(只管人的管理者)。公司强调技术能力,管理者无论级别高低,技术都非常强。

组织扁平。全公司好像只有Jason有个助理,其他人都没有。我问那团建之类怎么办。朋友说公司没有团建,没有圣诞节晚宴,只有全公司的大会。会上Jason一个人脱稿讲两个小时,是个段子手,讲完后不少员工上去跟他合影。

NVIDIA生态

听说已久NVIDIA生态做得好,我特地去问指的到底是什么,朋友讲得挺清楚:

提供完备的工具。芯片从下到上是个deep stack,需要有各种支持的工具,包括compiler、debugger、profiler等等。研发人员的需求各不相同,比如有人想做深度优化,这样仅仅把功能封装成API就不行。

系统的速度和易用性。

公司的内部和外部,横向沟通都做得很好。比如,公司有团队负责跟客户沟通,同时他们对内部技术也非常懂。客户有什么需求,他们很早就直接跟内部研发团队讨论。内部也如此。软件团队跟硬件部门密切合作,不是等硬件做好了再开发软件,而是在过程中及时交互配合。

华人企业国际化

中美关系的变化跟硅谷息息相关。我这次注意到两个明显的变化。创业者在市场选择上更专注,要么做美国市场,要么做中国市场,很少有人两边兼顾。国内一些好的创业者和基金也在这里寻找新的机会。

华人企业如何做好国际化是个大家普遍关心的问题。周末参加了一个闭门沙龙,讨论的主题就是这个,我觉得嘉宾挺有代表性:有做全球市场的华人上市公司CEO,有聚焦投资中国企业出海的基金合伙人,有管理中国和美国两边团队的创业者,我也是其中一位。大家分享了不少洞察。中国在研发成本、完备的供应链、互联网产品运营和勤奋度上有优势,但是出海面临着完全不同的挑战,涉及市场销售、产品、团队文化和管理等等。嘉宾有共鸣的一点,是要做国际化业务,创始人的思维首先要国际化。

我的感慨更多是在讨论之外。国际化这个话题我并不陌生,多年前讨论的,是美国企业如何拓展到中国。如今是反过来,讨论中国企业如何做国际市场。世界的重心在变,经过这些年的努力,中国真的强大了很多,让人自豪。

流动的硅谷

我一直非常羡慕硅谷的人才资源和自由交流的氛围。这里的人才密度大,我经常聊着聊着,发现是清华校友。我的大学本科班30人,其中6位在这里。周末参加一位好友组织的烧烤聚会,随便聊聊,发现好几位都谈吐不俗。再多问一句,原来是深藏不露的成功人士。

因为是硅谷,创业风气一直盛行。随之而来的是各种讲座、论坛等等。我刚来时,朋友给了我一个Google doc, 上面密密麻麻列了旧金山城里的AI线下活动,几乎每天都有。我进城不方便,只选择性地参加了几次。后来自己搜了下,对于感兴趣的话题,都找得到各种线上Webinar和社区讨论等等。后来熟悉了,发现湾区这边的活动也很多。无论线上还是线下,这些活动的质量普遍非常好,有大厂或头部创业公司核心成员,有年轻的创业者,分享的信息密度大、更新快,讲的人独立思考态度真诚技术前沿。我一向喜欢学习新东西,在这里过得兴致勃勃。

硅谷是流动的,流动的人才、流动的信息、流动的资金。这些流动带来了活力和创新,让每天都在变化,感觉永远年轻。

Share to:

Author: PA荐读

Opinions belong to the column author and do not represent PANews.

This content is not investment advice.

Image source: PA荐读. If there is any infringement, please contact the author for removal.

Follow PANews official accounts, navigate bull and bear markets together
PANews APP
U.S. stocks closed higher across the board, while crypto-related stocks showed mixed performance.
PANews Newsflash