98年“AI天才”、面壁智能CTO曾国洋：我像在创造一个新的智能生命体

发布时间：2024-06-24 02:28

【环球时报报道记者杨沙沙胡雨薇王冬】美国斯坦福大学三名学生组成的一个AI（人工智能）团队，抄袭中国大模型公司“面壁智能”的开源成果“小钢炮”MiniCPM-Llama3-V 2.5的闹剧，引发中美AI技术研发速度的对比。“斯坦福抄袭事件”发生后，《环球时报》记者在第六届北京智源大会见到了面壁团队，无论是创始人刘知远、还是CEO李大海，都尽力淡化此事。而面壁CTO（首席技术官）曾国洋的亮相，引起很多关注。这位被称为“AI天才”的26岁男孩，上台时还被主持人笑问“毕业了么”。被称为“AI界春晚”的北京智源大会是一个纯技术的会场，现场云集众多国内外AI领域人才，让《环球时报》记者十分好奇，中国AI界的生态什么样？“抄袭事件”是否对中国AI界产生震动？中国和美国在AI研发上，处于一种什么状态？《环球时报》记者就此专访了曾国洋。

抄袭事件涟漪

抄袭事件过去三周后，曾国洋从他自己的视角对《环球时报》记者还原此事。“最开始知道此事，还是来自开源网站GitHub的一些用户反馈，我们找到一些相关线索和证据，最终证明（斯坦福大学）确实发生了一个不太好的套壳现象。”曾国洋表示，事件最终以斯坦福本科生团队通过邮件形式道歉、删除相关的代码和产品收尾。

对此，斯坦福AI实验室主任曼宁发文谴责抄袭学生，并称MiniCPM“是很好的开源作品”。曾国洋表示，事件发生后，感受到挺多人的支持，也让更多人了解到，在开源领域很多中国大模型是值得关注的。

面壁智能首席科学家、清华大学长聘副教授刘知远接受《环球时报》记者采访时也表达了同样的感受，他认为，包括面壁在内的中国大模型，并不是因为抄袭事件才受到关注，之前中国在AI领域研发进展已经被关注。

一直被认为在“追赶美国”的国产大模型现在成了被抄袭的对象，是否意味着中国已经领先？曾国洋认为，不能说中美研发水平谁在前谁在后，而是一个“你追我赶”的状态。在开源领域，中国一直是大模型领域非常重要的一个玩家，中美都会不断有前沿的突破性成果出现。尽管很多国家相关研究机构也参与到大模型研发当中，“但在声量上，目前还是以美国和中国比较重要的重量级玩家为主”。

刘知远表示，在学术研究方面，10年前中国已能在国际上发表很多不错的学术论文。但他向记者一针见血地指出，相比国外，目前国内重复开发基础大模型是一种跟风、浪费，国内需把高质量制造大模型的平台系统搭建出来。他称之为建造“大模型光刻机”。

“光刻机的科学原理我们也掌握，但中国高端光刻机被‘卡脖子’，根本原因是我们在系统化、平台化方面做得没那么好。”刘知远以美国人工智能初创企业OpenAI为例说，ChatGPT推出来时，列出的贡献者有数百人，但到今年2月，文生视频大模型Sora问世，核心成员只有13人。这中间发生了什么？刘知远认为，OpenAI将此前大量程序员、科学家等完成的基础工作自动化、平台化，形成了自己的“大模型的光刻机”。Sora在这个基础上研发，自然不需要那么多人参与。

刘知远表示，需要更加清醒地认识到中国和先进技术水平的真实差距，“如果我们只是满足于复现ChatGPT，那就意味着我们以后不可能做出Sora、ChatGPT4o来。我们要把自己的‘大模型光刻机’给造出来，这是我们要努力的方向。”

“《三体》影响了我的职业方向”

曾国洋是刘知远在清华的学生，8岁自学编程、奥赛冠军保送清华。2015年年底，当奥尔特曼、马斯克等人创立OpenAI时，那时17岁的曾国洋，第一次接触AI概念。

曾国洋最早接触大模型，是OpenAI于2020年5月发布的GPT-3，当时他第一时间就去注册账号尝试，他感觉到“人工智能将有重大突破性机会，在未来一定有很大想象空间”，这也促成刘知远、曾国洋等人在2020年年底决定做国内第一个大模型。

“2019年那段时间，我们觉得，在NLP（Natural Language Processing, 自然语言处理，是计算机科学领域与AI领域中的一个重要方向——编者注）领域，我们已和国外基本上没有太大差距。但是GPT-3出现后，对NLP领域带来很大冲击。”他说。

2021年，刘知远牵头成立了面壁智能，清华计算机本科毕业的曾国洋是三个创业核心人物之一。为什么叫面壁？曾国洋回忆，他们先是创立一个人工智能开源社区叫OpenBMB，BMB读起来很像“面壁”，同时团队里有很多人是中国科幻作家刘慈欣科幻小说《三体》的粉丝，“面壁者”又在《三体》中扮演非常重要的角色，最后团队选择用“面壁智能”这个富有科技感的名字。曾国洋说，自己非常喜欢《三体》，“可以说，刘慈欣老师的《三体》影响了包括我在内中国一批人的职业方向”。

从10人到100人

在美国，也有一批年轻人在AI领域创业。Sora的核心团队最小成员出生于2003年。美国AI初创公司Pika labs的创始团队成员仅有4人，其中一个据称是95后的“杭州哈佛女孩”郭文景。曾国洋表示，大模型是一个新的技术变革，给了很多具有挑战精神、愿意尝试新技术的年轻人改变自己的机会。

在中国AI这个新兴领域，既有白发苍苍的学者，也有像曾国洋这样的年轻人。在第六届北京智源大会上，《环球时报》记者看到，一位中年工程师现场提问时，恭恭敬敬喊曾国洋“老师”。曾国洋表示，中国AI圈内并不是论资排辈，大家都互相称呼“老师”，大家都乐于去学习、接受新思想，主动去学习一些自己不懂的技术。

工作之余，曾国洋喜欢看新闻、去开源社区交流，甚至有时候还特别怀念写代码的日子。去年年初，面壁团队只有10个人不到，目前已经扩展到100多人，曾国洋需要整体负责大模型的研发工作。26岁，当很多年轻人大学刚毕业走上工作岗位，曾国洋已经是面壁智能公司的CTO。

对于外界称呼他是“AI天才”“中国版谢尔顿”，曾国洋坦言自己一直以来学习“还行”，也没看过美剧《少年谢尔顿》。“加入到计算机领域，去做人工智能，一直以来都是我的兴趣爱好在驱动着我，AI是一种非常非常有创造力的工作，我的工作就像在创造一个新的智能生命体一样。”曾国洋说，更愿意称呼自己是“AI艺术家”，“我在创造一个艺术性的生物”。

未来，AI能否取代人类？曾国洋认为，AI未来将作为一个助手去提升人类工作效率，并不能完全取代人类。对于AI完全取代了人类工作，这位26岁的年轻人有点向往，“也许人类可能就不需要工作了，会做一些更有创造性的事情，或者做自己特别想要做的事情”。

海量资讯、精准解读，尽在新浪财经APP

网址：98年“AI天才”、面壁智能CTO曾国洋：我像在创造一个新的智能生命体 http://c.mxgxt.com/news/view/13061

⬅️上一篇：五竹也生出了人类的情感

➡️下一篇：国家医保局通报：河南两家医院涉嫌

98年“AI天才”、面壁智能CTO曾国洋：我像在创造一个新的智能生命体

相关内容

随便看看

最新实时动态

热点实时动态

专题

推荐实时动态