月之暗面杨植麟:互联网研发是“种树”,大模型研发是“承包森林”
腾讯科技讯在5月18日举行的第五届上海创新创业青年50人论坛上,月之暗面创始人杨植麟发表演讲,分享了他的创业初衷、心得,以及对人工智能技术发展的看法。
杨植麟出生于1993年,是国内大模型企业月之暗面创始人,本科毕业于清华大学计算机系,博士毕业于卡内基梅隆大学计算机学院。曾就职于Facebook、谷歌等公司,在多个国际顶级AI会议发表论文20余篇。
对于创业时机的选择,杨植麟提到了两个主要因素,政府支持、风投支持以及创新人才,是其中最重要的创业环境的因素,而AI再次兴起、“第一性原理”对他的启发是另一个主要因素。
他认为,AI的发展得益于互联网、Transformer架构和半导体技术的发展,这三个天时地利的因素共同促成了AI to C的机会,“这三个天时地利,就是刚好发展到阶段,可能你早几年、晚几年,都不是最好的时机,刚好就是2022年底。”他提到,“互联网最大的价值,其实是为AI积累了二十多年的数据。”
杨植麟指出,多模态技术和数据瓶颈的突破是AGI发展的关键,需要通过生成数据来经营和扩展数据集。他认为,算力的提升和算力的利用率或效率是决定模型性能的两个关键因素。
杨植麟提到,长上下文技术类似于计算机时代的内存,对于处理复杂任务和提供个性化服务至关重要。今年3月,杨植麟的Kimi智能助手宣布支持200万字无损上下文,开启了国内大模型的长文本之战。
对于AI对打工人效率的提升,杨植麟预测,AI将逐渐处理更复杂的任务,并可能在工作流程中扮演更重要的角色,“可能从现在的比如说1%,未来有可能提升到90%甚至99%以上。”。
杨植麟称,大模型和互联网的开发方式完全不一样。互联网像“在一个地方种树”,是一种规划式的发展,很少遇到技术瓶颈;而大模型却类似“直接把整片森林包下来”,要去更多关注一些基础能力,然后让模型去涌现。
而对于创业,杨植麟坦言,希望把更多的精力、优先级放在“爬楼梯”上,而不仅仅只是去“看风景”,以此回应创业过程中对技术研发和商业变现之间的平衡取舍。“模型的能力还会有非常大的提升空间,我们今天可能还是在产业的开端,才刚刚做到10的25次方浮点数运算,那接下来很有可能会有10的26、27、28甚至29次方出现。”